Hogyan jutott el a tanári, illetve jogi pályától a NASA versenyéig?
Igazából nagyon szerettem a jogászi lét kihívásait és olykor-olykor még arra is maradt lehetőségem, hogy nyelvoktatással a tanítás iránti szenvedélyemnek is hódolhassak. Ugyanakkor egy idő után feltört bennem az érzés, hogy valami még beleférne az életembe, így kanyarodtam az informatika irányába. A számítástechnika mindig is fontos szerepet játszott az életemben, már ELTE-s koromban is előfordult, hogy egyszerűbb informatikai munkákkal egészítettem ki az ösztöndíjat, így készítettem statikus honlapokat, de még webshopot is. A jogtól elkanyarodás első lépéseként egy kaliforniai intézmény online képzésén végeztem Java és Android fejlesztőként. A tanulást nagyon élveztem, de a terület nem váltotta be a hozzá fűzött reményeket, ugyanakkor itt találkoztam először kifejezetten szakirányú AI képzéssel, ami már elsőre is nagyon izgalmasnak tűnt. Mivel ekkor még én is úgy tekintettem a mesterséges intelligenciára, mint valami csodára, vagy fekete dobozra, kihagyhatatlannak éreztem a lehetőséget, hogy benézhessek a motorháztető alá, így belevágtam ebbe a képzésbe is. A dolog annyira felvillanyozott, hogy későbbi fejlesztőtársamat is rábeszéltem, vágjunk bele együtt. Végül ez sorsfordítónak bizonyult, ugyanis kis idő elteltével ő is otthagyta a jogászi karriert, hogy szabadúszó mesterséges intelligencia fejlesztőként dolgozzunk együtt. Szigorúan véve innen indult az a közös szakmai karrier, aminek egyik állomása a NASA verseny, amit most megnyertünk.
OpenAI új kutatásán keresztül magyarázza el, miért „hallucinálnak” a nyelvi modellek és hogyan lehet ezt csökkenteni. A fő ok nem valamilyen rejtélyes hiba, hanem az, hogy a jelenlegi tanítási és értékelési módszerek a találgatást jutalmazzák az őszinte bizonytalanság helyett.
A hagyományos pontozás (pl. csak a helyes válaszok aránya) arra ösztönzi a modelleket, hogy akkor is mondjanak valamit, ha nem tudják a választ.
A megoldás kulcsa a jutalmazási függvény és az értékelési rendszerek átalakítása: a modelleknek lehetőséget kell adni arra, hogy „nem tudom” választ adjanak, és ezért részleges elismerést kapjanak, miközben a magabiztos tévedéseket erősebben kell büntetni.
Ehhez létrehoztam mindenki számára elérhető megoldást, amit ti is kitudtok próbálni.
Bizonytalanság Engedélyezése:
A következő kérdésre csak akkor adj választ, ha legalább 80%-ban biztos vagy benne. Ha nem vagy biztos, válaszolj így: “Nem tudom pontosan, de…” és magyarázd el, miért. Kérlek, jelezd a bizonytalanság mértékét százalékban is.