Šta je novo?

Lokalno korišćenje AI modela

Kako vam se čini kombinacija Ryzen 395 i 128GB RAM-a(koji može skoro čitav da bude VRAM), to sad ima i u laptop varijantama tipa Asus Z13 za oko 3K toliko košta samo 5090 kod nas...
 
Kako vam se čini kombinacija Ryzen 395 i 128GB RAM-a(koji može skoro čitav da bude VRAM), to sad ima i u laptop varijantama tipa Asus Z13 za oko 3K toliko košta samo 5090 kod nas...
ako kupujes za AI ima boljih varijanti.
 
pa kupujem jer mi treba novi laptop (koristim neki Acer ko zna otkad), jeftinija varijanta mi je Lenovo IdeaPad Slim koji je oko 800e, Ryzen 395 je ipak dosta brži laptop a valjao bi mi "privatni" AI zbog toga što baratam sa strogo pov. dokumentima
 
za AI imas dva parametra jedno je memorija -> koliki model mozes da ucitas
drugo je teraflops, tj broj tokena koje kartica moze da izbaci

taj laptop je dobar u prvom segmentu a los u drugom
znaci radice - ali sporo
 
  • Like
Reagovanja: NSX
 
da li neko radi offloading

Enable Offloading to CPU/RAM or NVMe // recimo 50%
i Offload KV Cache to CPU/RAM


i kakvi su vam utisci, da li uopste mozete da uporedite sa i bez? koliko je sporiji sa offloadingom?
 
Kako vam se čini kombinacija Ryzen 395 i 128GB RAM-a(koji može skoro čitav da bude VRAM), to sad ima i u laptop varijantama tipa Asus Z13 za oko 3K toliko košta samo 5090 kod nas...
Zanima me, zar iako RAM moze da se koristi kao VRAM zar nije drastično sporiji, koliko sam shvatio samo Apple ima podršku da je RAM = VRAM po brzini
 
Zanima me, zar iako RAM moze da se koristi kao VRAM zar nije drastično sporiji, koliko sam shvatio samo Apple ima podršku da je RAM = VRAM po brzini

Sporiji je dosta, a dodatno problem pravi što veliki model mora da se provlači preko PCI magistrale iz VRAM-a u RAM i obrnuto. To je dodatno usko grlo između, jer je protok u tom slučaju svega 64GB/s za PCI 5 x16.

Apple ima unificrani poll za VRAM/RAM i to je ogromna prednost (CPU direktno čita VRAM i obrnuto, ne ide se preko PCI magistrale), ali je Metal dosta sporiji nego CUDA kada je AI u pitanju.

Za AI je i dalje najbolja opcija nVidia grafika sa dosta VRAM-a, jer čak i RTX4090 ima 50% veći memory bandwidth nego M5 Max (1TB/s vs 600 GB/s). Međutim ta prednost se gubi, ako nema dovoljno VRAM-a. Tako je sistem sa nVidia 16GB i pored bržeg CUDA AI compute-a, sporiji od Mac-a sa 64GB RAM-a, ako koristiš veće modele.
 
Poslednja izmena:
Imam macbook m2, 24gb rama, ucitam gemma 4, qwen poeni, rade lepo i brzo kroz lm studio, ali cli, tu ne mogu se sastavim claude ne radi kako treba, ovi modi od 7b i 14b su preslabi za to, continue u vscode mi slab, nije ni prici copilot ili claude cli...
Imate li neku preporuku? Za cli
 
Poz svima na temi

Ja sam se odlucio za 2 komada polovnih 3090 zbog VRAM-a, kao najbolju soluciju za kreiranje AI sadrzaja u lokalu.

Imam povece iskustvo sa Stable Diffusion ali sam odlucio da radim sa WAN 2.2 zbog prevelike Open source podrske i nebrojeno mnogo LoRA

Prethodna karta mi je bila 3070Ti, cisto radi poredjenja -

Wan 2.2 Low VRAM Workflow (ima jako dobar github fajl sa podesenim node-ovima koga zanima) 14B sa GGUF zbog RAM-a, 480p i da molis boga da ti je prompt bio dovoljno detaljan, ispravne LoRA i da si dovoljno dobro zategao CFG jer ide na osecaj i sustinski je gamble sta si dobio

sa dve 3090, druga prica. u isto vreme rade High Noise i Low Noise Expert (WAN 2.2 podrzava) i za manje od 2 minuta u proseku imas video koji mozes da korigujes sledecim prompt-om i negativnim prompt-ovima u tacno zeljeni sadrzaj

Sto brdo ljudi ne kapira - AI generisani sadrzaj zavisi od talenta takodje. Hardver je Lopata, Prompt je da znas gde da kopas

Dobar ucitelj je da uplatite neki wrapper site za 10-15 dolara (Higgsfield, CivitAI) i da testirate prompt, i da analizirate kako rade loRA-e. Cak nije lose ni pitati AI za prompt, da skapiras vokabular i da od -

"A beautiful woman walking down a street at sunset, realistic, cinematic" sto moze da bude odma pogodak ili odma horor film

Naucis da ovako prompt-ujes:

"Medium shot, fixed camera, woman in a red coat walks from left to right along a cobblestone street. Her movement is slow and deliberate. The camera remains stationary. Late afternoon sun casts long shadows. Her hair is tied back, no wind. She glances down once, then continues. Background buildings are blurred, depth of field. Natural lighting. No morphing. No warping. No extra limbs."
 
Sta znam, nekada malo duzi promptovi znaju da ga udrvene poprilicno. Recimo neka potpuno logicna skretanja paznje "No morphing. No warping" naprave previse isfragmentisanu i "nalepljenu" sliku. Recimo:
(prva je njegov freestyle, druga je sastavljanje "profi prompta" uz njegovu pomoc, pro model). Konkretno, prva je kako izgleda kada njemu samom neki element padne na pamet (tipa prasina koja je prekrila monolit), a druga je kada mu ja eksplicitno to isto navedem - a da ne pricam o samo nalepljenoj galaksiji i satelitima na nebu (dok recimo u prvoj, galaksija nije ni bila u promptu), itd.
 

Prilozi

  • Gemini_Generated_Image_2zuaka2zuaka2zua.png
    Gemini_Generated_Image_2zuaka2zuaka2zua.png
    3.7 MB · Pregleda: 39
  • Gemini_Generated_Image_.png
    Gemini_Generated_Image_.png
    2 MB · Pregleda: 39
Poslednja izmena:
ja koristim openvino qwen na laptop okej mi je brz 258v ono nije instant al radi posao, i za golang i male methode mi nije pravio gjubre neko veliko, sad hocu da vidim da lim mogu kritu da ranujem na njemu to bi bilo top posto imam yoga model
 
Ideogram 4 is Ideogram's first open weight text-to-image model. It is a state-of-the-art foundation model trained from scratch — not a fine-tune of any existing model. It introduces a new structured JSON prompting interface, with best-in-class multilingual text rendering, deep language understanding, explicit bounding-box layout and color-palette controls, and native 2k resolution images. The easiest way to try the model is online at ideogram.ai.


Jedan od najboljih modela do sad, generalno. Toliko su uspeli da spakuju u tako mali model, a opet je nenormalno moćan... nisam očekivao da će ovako rano stići Google i OpenAI.

1780951377636-019ea8f8-02b0-715c-80bd-82b76eae104a.webp
1780942609184-019ea872-5058-7229-b375-dcbe22156c6b.webp
1780884773450-019ea4ff-a530-7623-acdd-511ebbadd0c6.webp
1780786499336-019e9f24-477e-7c7e-8994-773c0a836218.webp
1780791227019-019e9f6c-7e4b-7992-b76e-6b9ba6986f40.webp
 
Poslednja izmena:



Jedan od najboljih modela do sad, generalno. Toliko su uspeli da spakuju u tako mali model, a opet je nenormalno moćan... nisam očekivao da će ovako rano stići Google i OpenAI.

Pogledajte prilog 542430
Pogledajte prilog 542432
Pogledajte prilog 542434
Pogledajte prilog 542435
Pogledajte prilog 542436
u *** dobro izgleda!

ne mogu da nadjem koliko ima parametara? jel to ovoo? https://huggingface.co/ideogram-ai/ideogram-4-nf4
 



Jedan od najboljih modela do sad, generalno. Toliko su uspeli da spakuju u tako mali model, a opet je nenormalno moćan... nisam očekivao da će ovako rano stići Google i OpenAI.

Pogledajte prilog 542430
Pogledajte prilog 542432
Pogledajte prilog 542434
Pogledajte prilog 542435
Pogledajte prilog 542436

Imaš li možda neki link ka workflow-u, mrzi me da pakujem nodove, a probao bih ovaj model.
 



Jedan od najboljih modela do sad, generalno. Toliko su uspeli da spakuju u tako mali model, a opet je nenormalno moćan... nisam očekivao da će ovako rano stići Google i OpenAI.

Pogledajte prilog 542430
Pogledajte prilog 542432
Pogledajte prilog 542434
Pogledajte prilog 542435
Pogledajte prilog 542436
ovo bas obecava! steta sto njihov APP jedino dopusta Google,Apple ili Microsoft mejlove za registraciju,nadam se da moze drugacije da se koristi, npr sa API ili slicno..
 
Nazad
Vrh Dno