Nga e merr inteligjenca artificiale informacionin

Nga e merr inteligjenca artificiale informacionin e saj?

A keni ndonjëherë ulur aty duke kruar kokën, si… nga vijnë në të vërtetë këto gjëra ? Dua të them, inteligjenca artificiale nuk po kërkon nëpër pirgje pluhuri në biblioteka ose nuk po shikon tinëzisht filma të shkurtër në YouTube. Megjithatë, disi ajo nxjerr përgjigje për gjithçka - nga truket e lazanjës deri te fizika e vrimave të zeza - sikur të ketë brenda një dollap arkivimi pa fund. Realiteti është më i çuditshëm dhe ndoshta më intrigues nga sa mund të mendoni. Le ta zbërthejmë pak (dhe po, ndoshta të shkatërrojmë disa mite gjatë rrugës).


A është Magji? 🌐

Nuk është magji, megjithëse ndonjëherë ndihet kështu. Ajo që ndodh nën kapak është në thelb parashikimi i modeleve . Modelet e mëdha gjuhësore (LLM) nuk i ruajnë faktet në të njëjtën mënyrë siç truri juaj mban recetën e biskotave të gjyshes suaj; në vend të kësaj, ato janë të trajnuara për të hamendësuar fjalën tjetër (shenjën) bazuar në atë që erdhi më parë [2]. Në praktikë, kjo do të thotë se ato lidhen me marrëdhëniet: cilat fjalë qëndrojnë së bashku, si marrin formë zakonisht fjalitë, si ndërtohen ide të tëra si skela. Kjo është arsyeja pse rezultati tingëllon i saktë, edhe pse - me sinqeritet të plotë - është imitim statistikor, jo kuptim [4].

Pra, çfarë e bën informacionin e gjeneruar nga inteligjenca artificiale të dobishëm ? Disa gjëra:

  • Diversiteti i të dhënave - nxjerrja e të dhënave nga burime të panumërta, jo nga një rrjedhë e ngushtë.

  • Përditësime - pa cikle rifreskimi, prishet shpejt.

  • Filtrimi - idealisht kapja e mbeturinave përpara se të depërtojnë brenda (megjithëse, le të jemi realistë, ajo rrjetë ka vrima).

  • Verifikimi i kryqëzuar - mbështetja në burime autoritare (mendoni NASA, OBSH, universitete të mëdha), e cila është e domosdoshme në shumicën e manualeve të qeverisjes së IA-së [3].

Megjithatë, ndonjëherë trillon - me besim. Ato të ashtuquajturat halucinacione ? Në thelb, marrëzi të lëmuara, të transmetuara me një fytyrë të sinqertë [2][3].

Artikuj që mund t'ju pëlqejnë të lexoni pas këtij:

🔗 A mund të parashikojë inteligjenca artificiale numrat e lotarisë?
Duke eksploruar mitet dhe faktet rreth parashikimeve të lotarisë me inteligjencë artificiale.

🔗 Çfarë do të thotë të kesh një qasje holistike ndaj inteligjencës artificiale
Kuptimi i IA-së me perspektiva të ekuilibruara mbi etikën dhe ndikimin.

🔗 Çfarë thotë Bibla për inteligjencën artificiale
Duke shqyrtuar perspektivat biblike mbi teknologjinë dhe krijimin e njeriut.


Krahasim i shpejtë: Nga ku mbështetet inteligjenca artificiale 📊

Jo çdo burim është i barabartë, por secili luan rolin e vet. Ja një pamje e shkurtër.

Lloji i burimit Kush e përdor atë (IA) Kosto/Vlerë Pse funksionon (ose nuk funksionon...)
Libra dhe Artikuj Modele të mëdha gjuhësore I paçmuar (pothuajse) Njohuri të dendura dhe të strukturuara - thjesht plaken shpejt.
Faqet e internetit dhe blogjet Pothuajse të gjitha inteligjencat artificiale Falas (me zhurmë) Varietet i egër; përzierje shkëlqimi dhe mbeturinash absolute.
Punime Akademike Inteligjencat Artificiale të përqendruara në kërkime Ndonjëherë me pagesë Rigorozitet + besueshmëri, por të shprehura me zhargon të rëndë.
Të dhënat e përdoruesit Inteligjenca Artificiale të Personalizuara Shumë i ndjeshëm ⚠️ Rrobaqepësi e mprehtë, por me shumë probleme me privatësinë.
Uebi në kohë reale Inteligjencat Artificiale të lidhura me kërkimin Falas (nëse është online) Mban informacionin të freskët; disavantazhi është rreziku i amplifikimit të thashethemeve.

Universi i të Dhënave të Trajnimit 🌌

Kjo është faza e “të mësuarit në fëmijëri”. Imagjinoni t’i jepni një fëmije miliona libra me përralla, prerje lajmesh dhe faqe të fshehura nga Wikipedia, të gjitha në të njëjtën kohë. Kështu duket trajnimi paraprak. Në botën reale, ofruesit mbledhin së bashku të dhëna të disponueshme publikisht, burime të licencuara dhe tekst të gjeneruar nga trajnerët [2].

Shtresa sipër: shembuj njerëzorë të kuruar - përgjigje të mira, përgjigje të këqija, shtytje në drejtimin e duhur - para se të fillojë përforcimi [1].

Kusht për transparencë: kompanitë nuk zbulojnë çdo detaj. Disa mbrojtje janë sekrete (pronësia intelektuale, shqetësimet për sigurinë), kështu që ju keni vetëm një dritare të pjesshme në përzierjen aktuale [2].


Kërkim në Kohë Reale: Shtesa Shtesë 🍒

Disa modele tani mund të shohin jashtë flluskës së tyre të trajnimit. Ky është gjenerimi i shtuar i rikuperimit (RAG) - në thelb nxjerrja e pjesëve nga një indeks i drejtpërdrejtë ose një dyqan dokumentesh, dhe më pas thurrja e tyre në përgjigje [5]. Perfekt për gjëra që ndryshojnë me shpejtësi, si titujt e lajmeve ose çmimet e aksioneve.

Problemi? Interneti është njëkohësisht gjenialitet dhe zjarr mbeturinash. Nëse filtrat ose kontrollet e origjinës janë të dobëta, rrezikoni që të dhënat e panevojshme të kthehen tinëzisht - pikërisht për atë që paralajmërojnë strukturat e rrezikut [3].

Një zgjidhje e zakonshme: kompanitë i lidhin modelet me e tyre të të dhënave të brendshme, kështu që përgjigjet citojnë një politikë aktuale të burimeve njerëzore ose një dokument të përditësuar të produktit në vend që ta anashkalojnë atë. Mendoni: më pak momente "ëëë", më shumë përgjigje të besueshme.


Rregullim i hollësishëm: Hapi i lustrimit të inteligjencës artificiale 🧪

Modelet e para-trajnuara janë të vështira. Kështu që ato rregullohen me kujdes :

  • Mësimi i tyre të jenë të dobishëm, të padëmshëm, të ndershëm (nëpërmjet mësimit përforcues nga reagimet njerëzore, RLHF) [1].

  • Lëmimi i skajeve të pasigurta ose toksike (rreshtimi) [1].

  • Përshtatja e tonit - qoftë ky miqësor, formal apo sarkaztik me shaka.

Nuk është aq shumë lëmimi i një diamanti, sa është nxitja e një ortek statistikor që të sillet më shumë si një partner bisede.


Gabimet dhe Dështimet 🚧

Le të mos pretendojmë se është i përsosur:

  • Halucinacione - përgjigje të qarta që janë krejtësisht të gabuara [2][3].

  • Paragjykim - pasqyron modelet e integruara në të dhëna; madje mund t'i amplifikojë ato nëse nuk kontrollohet [3][4].

  • Pa përvojë të drejtpërdrejtë - mund të flasë për receta supash, por nuk e ka provuar kurrë një të tillë [4].

  • Vetëbesim i tepruar - proza ​​rrjedh sikur di, edhe kur nuk e di. Kornizat e rrezikut theksojnë supozimet e zbehta [3].


Pse Ndihesh Si të Dish 🧠

Nuk ka besime, nuk ka kujtesë në kuptimin njerëzor dhe sigurisht nuk ka vetvete. Megjithatë, për shkak se i lidh fjalitë së bashku pa probleme, truri juaj e lexon atë sikur e kupton . Ajo që po ndodh është thjesht parashikim masiv i shenjës së radhës : duke përpunuar triliona probabilitete në sekonda të tëra [2].

Atmosfera e “inteligjencës” është sjellja emergjente - studiuesit e quajnë atë, paksa ironike, “papagallit stokastik” [4].


Analogji e përshtatshme për fëmijë 🎨

Imagjinoni një papagall që ka lexuar çdo libër në bibliotekë. Nuk i kupton historitë, por mund t’i përziejë fjalët në diçka që të duket e mençur. Ndonjëherë është e saktë; ndonjëherë është e pakuptimtë - por me mjaftueshëm talent, nuk mund ta dallosh gjithmonë ndryshimin.


Përmbledhje: Nga vjen informacioni i inteligjencës artificiale 📌

Me fjalë të thjeshta:

  • Të dhëna masive trajnimi (publike + të licencuara + të gjeneruara nga trajnerët) [2].

  • Përmirësim i imët me reagime njerëzore për të formësuar tonin/sjelljen [1].

  • Sistemet e rikuperimit kur lidhen me rrjedha të dhënash të drejtpërdrejta [5].

IA nuk i “di” gjërat - ajo parashikon tekstin . Kjo është njëkohësisht superfuqia e saj dhe thembra e Akilit. Në fund të fundit? Gjithmonë krahasoni gjërat e rëndësishme me një burim të besueshëm [3].


Referencat

  1. Ouyang, L. et al. (2022). Trajnimi i modeleve gjuhësore për të ndjekur udhëzimet me reagime njerëzore (InstructGPT) . arXiv .

  2. OpenAI (2023). Raporti Teknik GPT-4 - përzierje e të dhënave të licencuara, publike dhe të krijuara nga njeriu; objektivi dhe kufizimet e parashikimit të token-it të ardhshëm. arXiv .

  3. NIST (2023). Korniza e Menaxhimit të Riskut të IA-së (AI RMF 1.0) - prejardhja, besueshmëria dhe kontrollet e riskut. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Mbi rreziqet e papagajve stokastikë: A mund të jenë modelet gjuhësore shumë të mëdha? PDF .

  5. Lewis, P. et al. (2020). Gjenerimi i Rikthimit të Shtuar për NLP me Intensitet të Njohurive . arXiv .


Gjeni IA-në më të fundit në Dyqanin Zyrtar të Asistentëve të IA-së

Rreth Nesh

Kthehu te blogu