Egy svájci és német kutatók által készített új benchmark azt mutatja, hogy még az olyan csúcsmodellek is, mint a Claude Opus 4.5 – bekapcsolt internetes kereséssel –, az esetek közel egyharmadában még mindig téves információkat adnak.
Jensen Huang, az Nvidia vezérigazgatója azt állítja, hogy az LLM-ek (nagy nyelvi modellek) már nem hallucinálnak, ám a tudomány ezzel nem ért egyet. A svájci EPFL, a tübingeni ELLIS Intézet és a Max
...




