
13/08/2025
👇
'Neața bună! La☕️ cu știri din știință și tehnologie azi. Vin cu trei studii despre cm IA va deveni din ce în mai indispensabil pentru experți (în redactarea de newsletter e demult indispensabil 😊)
🗞️ 1) Studiu nou: GPT-5 trece testele medicale pe text + imagini, cu scoruri peste nivelul studenților în ani terminali la medicină
Astfel, avem confirmări ale faptului că chatgpt5 este un progres substanțial față de modelele anterioare de LLM. Dacă, de exemplu, chatgpt3.5 era bătut de studenții de la farmacie în teste de diagnostic, un studiu recent arată cm chatgpt5 obține scoruri mai bune decât studenții în ani terminali la medicină sau alte LLM-uri la acest tip de teste:
Publicată pe 11 august 2025, cercetarea testează GPT-5 pe întrebări medicale și radiografii/ecografii și arată scoruri mai bune decât modelele anterioare și decât un grup de „experți umani pre-licență” (viitori medici înainte de obținerea licenței) pe unul dintre cele mai grele teste multimodale.
📊 Rezultatele pe scurt (MedXpertQA multimodal):
�• +29,62% la „reasoning” și +36,18% la „understanding” față de GPT-4o.
�• Chatgpt 5 obține peste studenții în ani terminali cu +24,23% (reasoning) și +29,40% (understanding).
�Acest benchmark este conceput tocmai pentru a măsura cunoștințe medicale avansate și raționament de tip specialist.
🧪 Unde a mai fost testat: seturi standard din literatură — MedQA, MMLU-medical, USMLE (self-assessment) și VQA-RAD — sub același protocol de evaluare, fără antrenament specializat pe fiecare set („zero-shot”). Rezultatul: GPT-5 atinge sau depășește nivelul mediu la toate aceste teste.
🏥 De ce contează: astfel de modele ar putea sta la baza viitoarelor sisteme de suport pentru decizia clinică (CDSS) — triere mai rapidă, a doua opinie pentru interpretarea unor imagini, verificarea pașilor recomandați într-un caz clinic.
Link în comentarii
🗞️ 2) AI pe post de asistent al consilierului școlar: compunerile scrise la 11 ani pot prezice rezultatele educaționale și trăsăturile psihologice de mai târziu—AI-ul rivalizează cu profesorii�
Un studiu publicat în Communications Psychology arată că folosind compuneri de ~250 de cuvinte scrise la vârsta de 11 ani (cohorta britanică NCDS, generația 1958), modele bazate pe LLM pot prezice rezultate educaționale și trăsături cognitive/psihologice cu acuratețe comparabilă evaluărilor profesorilor și net peste predicțiile din date genetice.
🔎 Cum au făcut: Au folosit un eșantion britanic de mai bine de 10.000 de eseuri dintr‑o cohorta din 1958. Eseurile copiilor au fost transformate în „amprente” numerice ale textului (embeddings) și transformate în sute de indicatori de limbaj (diversitate lexicală, lizibilitate, erori gramaticale). Apoi, un ansamblu de algoritmi („SuperLearner”) a prezis abilități cognitive, trăsături non-cognitive și nivelul final de educație, care au fost comparate riguros cu datele actuale (cross-validation).
📊 Rezultatele-cheie:
�• Predicțiile din texte sunt aproape la fel de bune ca evaluările profesorilor pentru evaluarea abilităților cognitive și pentru predicția educației la 33 de ani și mai bune decât scorurile poligenice (genetică).
�• Combinând text + genetică + evaluări de profesor, modelul ajunge aproape de fiabilitatea test-retest pentru abilități cognitive (R²_holdout ≈ 0,70) și explică ~38% din diferențele individuale în nivelul de educație la 33 de ani.
🏫 De ce contează: arată că un text scurt din copilărie conține semnale bogate despre viitorul educațional/psihologic—util pentru screening timpuriu și intervenții țintite (de ex., sprijin educațional), dacă sunt respectate standarde înalte de etică și confidențialitate.
Referință: Tobias Wolfram, Large language models predict cognition and education close to or better than genomics or expert assessment, Communications Psychology (2025). DOI: 10.1038/s44271-025-00274-x.
❗️3)Viitorul joburilor în epoca AI: ai carte n-ai parte?
📊 Un nou studiu (destul de celebru de altfel) al Microsoft (publicat pe 6 august 2025) a analizat interacțiuni reale cu Bing Copilot pe parcursul a nouă luni în 2024 pentru a vedea în ce măsură AI poate prelua anumite sarcini de muncă — precum cules de informații, rezumare sau redactare. În funcție de cât de bune erau AI-ul la aceste activități, cercetătorii au calculat un scor numit „AI applicability score” pentru diverse profesii.
⚠️ Cele mai vulnerabile/ dependente deja de AI sunt cele orientate spre muncă cognitivă și comunicare – în special:
* traducători
* istorici
* scriitori
* specialiști în date (data scientists)
* reprezentanți în relații cu clienții
🔧 La polul opus, profesiile care implică: muncă fizică, operarea de utilaje, interacțiune umană directă au primit scoruri scăzute, indicând o rezistență mai mare la automatizare.
🎓 Ocupațiile care cer studii superioare (licență) tind să fie mai expuse la AI decât cele cu cerințe mai joase (diferență semnificativă statistic).
📈 Pe de altă parte, studiul raportează o corelație moderată între predicțiile teoretice din alte studii privind impactul AI și ceea ce s-a observat efectiv în conversațiile reale.
Link în comentarii