Šta je novo?

AI chatbotovi i asistenti - generalna tema

Ja mislim da je problem sa svim modelima sto gube memoriju i kontekst tokom razgovora, a to je zbog toga sto su tako napravljeni da stede resurse. Cak i ta halucinacija je posledica toga sto dobijaju manje resursa u nekom trenutku a imaju zadatak da uvek daju neku informaciju ili resenje. Mislim da nijedan AI nikada nece reci "ne znam" kao odgovor na neko pitanje, vec ce da daje neki informacije cak i ako nemaju veze sa realnoscu. Cak i placeni modeli su prilicno ograniceni u resursima koje koriste.
 

Ovo je benchmark koji meri sposobnost AI-a da razume šta neki program radi samo kroz eksperimentisanje, i onda ga reimplementira od nule.

Rezultati su bas niski.

Trenutno vodeći model (GPT 5.5 xhigh) rešava 0.5% taskova potpuno. "Almost resolved" (≥95% testova prođe) dostiže 13.5%. Svi ostali modeli imaju 0% potpuno resenih taskova.
 
Da, ima smisla, no druga strana medalje je što 95% softvera nema ni 0.01% nekog inovativnog koda, nečeg toliko posebnog i novog da to nikad nije viđeno nigde. Većina poslovnog softvera je CRUD tipa, ako i imaju neke algoritme, onda su to relativno davno poznata rešenja koje se svode na running totale sa brojanjem ili sabiranjem nečega (da se dobije neko stanje (zbir) ili count nečega, napr. dana od kada se desilo X), većina se čak implementira u SQL procedurama ne većim od 100 linija ili 50 lnija nekog C# koda i mogu se napisati kao malo veći razlomak koji može da reši osnovac u 3. razredu bez problema, a odavno su isti takvi po tim firmama napisani u excel formulama pa se samo prevode u neke aplikacije da se ne bi excel ručno punio svakog meseca.
 
Nazad
Vrh Dno