Da, ali nemoj da probas tekst ako vec isprobavas vec i neke druge varijante, slike, tabele, okvire, sta ja znam sta sve moze...
Nije mi baš bio prioritet da prvo sa ovim eksperimentišem, ali zahvaljujući tome da sam odmah naleteo na pogodne dokumente, odlučio sam se da izgubim 3 sata da ovo.
Test "aparatura"
Na mojoj mašini instaliran je Office2003, a na virtualnoj je instaliran Office2007. Instalacija na VM može uticati samo na brzinu O2007, ali to nije predmet ovog testa.
Ispitivanje je rađeno na dva dokumeta:
1. Microsoftova brošura na 5 strana u koloru koja sadrži višestubačni tekst, slike u boji i textboxove. (ako hoće neko da se zeza okačiću na Rapidshare)
2. Izveštaj sa merenja, interni dokument sa bivše šljake. Dokument je kombinacija ćiriličnog i latiničnog teksta na nekih 40-ak strana, sa ubačenim slikama i vrlo složenim dijagramima (u pcx formatu) sa ogromnim brojem tabela od kojih je dobar deo zbog svoje veličine zahtevao da listovi budu okrenuti landscape. Sve u svemu mrak od dokumenta, dušu dao za ovako nešto. (Nažalost, reč je o zvaničnom izveštaju rađenom za naručioca i ne mogu da ga priložim - profesionalna etika ,) )
Metodologija ispitivanja
Na virtualnoj mašini je dokument prvo učitan u Word 2007 i snimnjen kao docx. Zatim je Word ugašen pa ponovo upaljen pa je otvoren novonapravljeni docx i onda rađena konverzija u "Word 97-2003 Document" (doc) i "Word 2003 XML document" (xml) respektivno. Sledeći korak je otvaranje tih fajlova iz Worda 2003 na host mašini kako bi videli rezultat.
Rezultati
Dokument 1 je bez problema preživeo sve transformacije doc -> docx <reset worda> docx ->
doc; xml Word 2003 je otvarao bez problema novodobijeni doc i xml i u tim dokumentima nije bilo nikakvih anomalija. Onakvi su kakvi su i u "originalu". Ovde postoji interesatno zapažanje, tiče se veličine fajlova. Originalni doc je 2255KB, docx dobijen iz njega je skoro duplo veći(!) - 3957KB. Nakon transformacije ponovo u doc, veličina je bila blizu originalu (2196 KB), xml je veličine 1766 KB (!!). Po meni ne baš očekivano.
Dokument 2 je takođe prošao sve transformacije i svi dokumenti u potpunosti izgledaju kao "početni". Original je 2516 KB, docx je 1344 KB. Ovo je za razliku od prethodnog dokumenta i očekivano. Ponovno dobijeni doc je 2748 KB, i Word 2003 ga otvara regularno i u potpunosti izgledom odgovara početnom. Transformacija u xml je trajala tek par sekundi duže i dala je fajl od 10760KB što i nije iznenađenje obzirom na veličinu, strukturu i složenost dokumenta. Otvaranje xml iz Worda 2003 bio je prilično pipav posao. Naime to ume da potraje. Jednom je mojom krivicom puklo, a onda je Word pokušavao da uradi repair i nakon 15 min sam ga prekinuo, obrisao i ponovo ga eksportovao iz 2007. Ovaj put je sve prošlo OK potrajalo nekih 30-40 sekundi i otvorio se dokument koji potpuno odgovara originalu.
Dakle sve radi, i mislim da uz malo pažnje i razmišljanja se može dobiti sadržaj dokumetna čak i kod prilično složenih bez obzira na verziju. Veličina naravno varira.
Napomena: Potencijalni propust u metodologiji
Hipotetičku situaciju čiji je primer u nekoj od ranijih poruka dao Civil nije bilo moguće simulirati u potpunosti. Naime, nisam imao ni jedan jedini docx koji sam direktno uradio u Wordu 2007, a koji bi po složenosti odgovarao uslovima testa, naročito nešto tipa dokumenta 2, koji je pisan i slagan nekoliko dana od strane 3 čoveka. Praktično sam bio prinuđen da praktično izvorni doc vrtim u krug. Pošto nisam baš toliko verziran da znam kako tačno Word (i stari i novi) tretiraju datoteke, a želeo da izbegnem da mi iz nekog keša uvali isti fajl, poušao sam to da izvedem gašenjem i ponovnim pokretanjem Worda. To je Nedostatak izvornog docx je tako jedina "rupa" u ovom testiranju, ali mislim da ne bi trebalo da utiče na zaključke. Ako Word 2003 uspe da bez greške otvori dokument iz onog totalno divljeg xml, čisto sumnjam da je docx -> doc konverzija (koja je verovatno prvi izbor u takvim situacijama) lošije urađena. Ko hoće da proverava dalje mogu da mu dam ahrivu sa docx-om Dokumenta 1, pa nek se zeza, ja nemam više volje.
Zapažanja
Kapitalna dostignuća u nauci, često su postignuta pukim slučajem. Ovo, ništa manje značajno istraživanje

nije bilo izuzetak ,) Da ne palamudim... Na hostu, gde je samo Word 2003, kliknuo sam greškom na jedan od docx fajl i Word me je nakon par sekundi obavestio o sledećem: "
This file is created by newer version of Microsoft Word. Do you want to download a compatibility pack so You can work with this file" :eyebrows: Klik na Yes baca me na sledeći
link i "Microsoft Office Compatibility Pack for Word, Excel, and PowerPoint 2007 File Formats". Nakon instalacije, gle čuda i Word 2003 otvara docx, čak i onaj suludi izveštaj. :banana:
Prema tome Civil, čukaj diplomski kako ti volja, a turi fajl sa linka odozgo na flash pa profanu apdejtu "anahroni" Office2003
Ljudi toliko od mene, odlepio sam od buljenja u ekran. U sledećoj epizodi, o par potencijalnih bagova. Sad odo' na jedan nightcup of vinjak da mi ova slova prestanu da igraju
