2012-05-21

Well, takze jak prejit na Blogspot, ver. 2.0 :)

V uvodu predesilam, ze nize uvedeny postup premigruje vsechny texty (i.e. clanky s komentarema). Obrazky do toho nespadaji. Ty zustanou v clancich nalinkovany na bloguje.cz. Uplne dole nastinim mozny reseni. Taky pouzivam online konvertor, který deklaruje, ze ma limit na soubor 1MB, cili vetsi pisalci muzou narazit na problem (ja mam zalohu velkou zhruba 0.6MB, takze se do limitu vejdu – az se najde nekdo, kdo narazi, at mi da vedet, domluvime se, jak to zkusit prekecat :))

Cili jaky je postup?

Nejdriv je nutny stahnout zalohu blogu - V administraci [http://bloguje.cz/blox/admin.php?actx=2] kliknout nahore na "Nastavení" a pak vpravo na odkaz "Záloha (.XML)" – stahne se soubor "wp.xml".

Stazeny soubor bohuzel trpi neduhem spatneho kodovani – je tedy potreba ho upravit v nejakem "chytrem" editoru (cili nikoliv Poznamkový blok z Windows!!! :). Ja jsem puvodne pouzival Crimson Editor, ale zjistil jsem, ze ani ten si s kodovanim neporadi dobre (nektere ceske znaky prevede bez diakritiky), takze jsem nakonec pouzil Notepad++ [http://download.tuxfamily.org/notepadplus/6.1.2/npp.6.1.2.Installer.exe] – ten ma navic tu vyhodu, ze je lokalizovany, takze ho zvladnou pouzivat i ti, kteri nevladnou mluvou anglickou (pri instalaci je potreba v seznamu instalovanych soucasti vybrat Localization -> Cestina). Nasledujici postup je tedy pro Notepad++.

Stazeny soubor "wp.xml" tedy otevreme v Notepad++ (kdo se boji, ze neco zkazi, muze si napred udelat kopii) a znovu ho ulozime (menu File -> Save, resp. Soubor -> Ulozit, klavesova zkratka Ctrl+S - na tohle, s dovolenim, screenshot delat nebudu :)

Ted uz pristoupime k normalizaci, i.e. nahrazeni specialnich znaku spravnym retezcem. Je to potreba, pokud nejaky clanek nese v nazvu jeden z techto znaku: &, ', ", <, >. Cili spustime funkci Replace (menu Search -> Replace, resp. Najit -> Nahradit, klavesova zkratka Ctrl+H) a do pole "Find what" (Najit) napiseme " & " a do pole "Replace with" (Nahradit) napiseme " &amp; " a klikneme na tlaticko "Replace All" (Nahradit vse). Vsimnete si, prosim, tech mezer okolo!

Notepad++ nam vzdycky povi, kolikrat se v souboru ten retezec vyskytoval (kolikrat ho prepsal). Tento postup zopakujeme pro zbyle znaky analogicky podle tohoto seznamu (opet je potreba dodrzet to "obaleni" mezerami, jinak si ten soubor cely rozbijete a nepujde to prekonvertovat!):

  • & - &amp;
  • < - &lt;
  • > - &gt;
  • " - &quot;
  • ' - &#39;
Ted jeste upravime nazvy kategorii (rubrik), protoze jinak nam zustanou clanky s nazvy katerogii ve tvaru "tema-<n>-nazev-s-pomlckami.php". Jiny system zalozeny na WordPress si s tim asi poradi, ale BlogSpot nikoliv, a je tudiz nutne to napravit. Opet pouzijeme funkci Replace (Nahradit) a jako "Find what" (Najit) napiseme nazev kategorie s pomlckami (viz obrazek) a do pole "Replace with" (Nahradit) napiseme Nazev, ktery chceme – a znovu nahradime vse.

Takhle to provedeme pro vsechny kategorie, i pro Nezařazené (chceme-li zachovat diakritiku).

Z ciste kosmetickych duvodu jsem jestt v celem souboru nahradil retezec "http://tatatulen.blogspot.com" novou adresou "http://tatatulen.blogspot.com" (pouzivam v komentarich odkaz na blog, tak aby se mi na blogspotu nepletla v komentarich stara adresa) – ale to uz neni bezpodminecne nutne (coz neni ani to prepsani kategorii, zejo :))

Po dokonceni zmen samozrejme soubor ulozime! :)

Tak, ted mame soubor pripraveny na prvni pokus online konvertorem - otevreme si stranku http://wordpress2blogger.appspot.com/, klikneme na tlaticko "Browse" (Prochazet) u pole v bodu 6, vybereme upraveny soubor "wp.xml" a klikneme na tlacitko "Convert". Pokud je vse v poradku, tak nam konvertor nabidne ke tazeni soubor "blogger-export.xml".

Pokud je něco v neporadku, tak vam konvertor napise, co je v neporadku a na jakem radku a sloupci to mate hledat - napriklad takto:

Cili vime, ze na radku 597 je na pozici 3406 nejaky znak, ktery tam byt nema. Otevreme si tedy soubor "wp.xml" opet v Notepad++ a pomoci prikazu Go To (menu Search -> Go To, resp. Najit -> Prejit na, klavesova zkratka Ctrl+G) prejdeme na prislusny radek:

Pak je potreba najit prislusny sloupec. K tomu nam pomuze indikace pozice vpravo dole na stavovem radku. Nekdy cislo sloupce nesedi presne s tim, co nam ohlasil online konvertor, ale vetsinou je ten spatny znak do dvou sloupcu okolo (a v Notepad++ se pozna tak, ze je zvyraznen a je ve tvaru "x<cislo>":

Tyto znaky je nutne bud smazat, nebo nahradit. V pripade ze screenshotu se jedna zrejme o trojitou tecku, takze ja jsem prepsal na "&" Nektere znaky je mozne vybrat mysi, zkopirovat a potom pomoci funkce Replace (Nahradit) prepsat na spravny tvar v cemem souboru, ale nekdy je to znak natolik zmrseny, ze to nejde.

Po nahrazeni a znovu ulozeni zkusime stesti z online konvertorem znovu - bud uz nam tentokrat nabidne ke stazeni "blogger-export.xml", nebo nam zase napise, kde je chyba. Takhle cyklicky pokracujeme, dokud vysledkem neni soubor "blogger-export.xml".

Kdyz mame soubor "blogger-export.xml", tak uz je to velice jednoduchy. Otevreme si administraci Blogspotu, klikneme na Settings (Nastaveni - poslední polozka v administracnim menu), pak na Other (Jine - dtto) a pak na Import blog (Importovat blog):

V dialogu, ktery se nam otevre, klikneme na tlacitko Browse (Prochazet), vybereme stazeny soubor "blogger-export.xml", opiseme dve slova a klikneme na tlaticko Import Blog (Importovat Blog). Pripadne muzeme odskrtnout policko "Automatically publish..." (Automaticky poblikovat...), abychom pred publikovanim provedli kontrolu.

Dobre, a jak premigrovat obrazky?

Prvni vec je zazalohovat si blog. Postup v odkazu stahne i obrazky a ty je pak mozne nahrat do blogspotu a prispevky s obrazkama rucne upravit. Chapu, ze pro me s triatriceti obrazkama je to otazkou nekolika minut, ale pro nekoho, kdo ma obrazku vic uz to nemusi byt unosne.

Napada me uz pak jen nakopirovat obrazky na nejaky jiny hosting tak, aby cesta k obrazkum zustala vždy stejna a před konverzi na blogspot nahradit retezec "http://vas_blog.bloguje.cz/img/" retezcem z adresy, kde budou obrazky lezet, ale to není rozhodne idealni reseni.

Mozna taky pujde nejak zjistit seznam nahranych obrazku na Blogspot a ty pak pomoci nejakeho skriptu sparovat s puvodnim umistenim a nahradit v exportu z Bloguje, ale to uz necham na nejakyho jinyho koumaka. Zaklad blogu jsou prece jen texty a o ty tu slo predevsim...

P.S. - jak prejit na jiny server zalozeny na WordPressu, psal Tasselhof.

P.P.S. - MM, alias Misantrop, alias Arthur Dent nabizi zalohu a prevod blogu pod jeho kridla.

31 komentářů:

  1. Jé, díky! Představ si, že celý blog squiresfamily prošel konvertorem už na třetí pokus! Jenom dvě error hlášky! Fotky tam samozřejmě nejdou, ale videa z youtube kupodivu ano:-DDDsquire nezálohuju, ale dětský deníček by mi bylo líto ztratit...

    OdpovědětVymazat
  2. Squire......to jsem rad. Fotky bohuzel, ale pomoci toho wgetu to pujde zazalohovat. Zkusim najit zpusob, jak to rozumne prenest, treba to pujde...

    OdpovědětVymazat
  3. SuprZrovna jsem trávila poslední minuty vnímání zakládáním blogu na Blogspotu za účelem importu odsud a řešením, co to je za blbou chybu, kvůli které to nejde.Tenhle článek ukládám do záložek pro dobu, až najdu čas a síly k zachraňování minulosti. Díky.

    OdpovědětVymazat
  4. ja chci taky zachranit fotky do clanku!

    OdpovědětVymazat
  5. Spoon......hledam nejjednodussi zpusob. S tim Blogspotem to pujde asi blbe - jednak maj adrasy generovany nahodne zvlast pro thumbnail a zvlast pro fotku samotnou a druhak uz jsem dost vysel ze cviku, co se hatmatilky tyce.Asi nejjednodussi cesta bude najit nejakej webhosting s vlastnim ftp, tam prehulakat fotky ze zalohy a prepsat adresy k obrazku v zaloze z bloguje... Zkusim neco najit a prsknu to sem.Toz tak...

    OdpovědětVymazat
  6. Já mám fotky na rajčeti, do článků vkládané jako linky z rajčete. Na blogspot to přešlo půl ano, půl ne - ale myslím, že hcyba je v rajčeti, protože to mi dělalo i na bloguje, že staré fotky se nezobrazovaly. Asi rajče samotné nějak přesouvalo obsah a změnilo adresy fotek.

    OdpovědětVymazat
  7. Squire......obrazky linkovane odjinud v clancich zustanou. Pokud se nezobrazujou, chyba je na cilovem serveru (cili na rajceti).

    OdpovědětVymazat
  8. Tak zatim zadna slava......vsechny webhostingy bud maji maly limit, nebo vyzaduji reklamu (a tedy zive stranky), nebo zakazuji linkovani odjinud... filehostingy/webgalerie zase do jednoho generuji odkaz na soubory/obrazky dynamicky...Tady uz zbyva jedine ta Misantropova nabidka - tvrdi, ze to presune i sobrazkama...

    OdpovědětVymazat
  9. Tak jsem nasel......http://www.0fees.net/signup.php - vypada to dobre, je to bez reklamy, na uvodni strance pisou 250MB a 6GB/mesic, ve statistikach 1GB/10GB, linkovani odjinud zrejme nezakazano (resp. zatim jsem ho nenasel :)Snad se mi behem dneska podari sepsat nejaskej navod se screenama

    OdpovědětVymazat
  10. tatotuleni ja mam ty fotky samozrejme vsechny fyzicky na externim hardisku,pekne srovnany v adresarich podle dat a akci, pokud to nepujde prevyst z bloguje v ramci clanku holt bude to stary bez fotek a to novy s fotkama, navic na ten blogspot to slo zpusobem Ctrl+C a Ctrl+V davat cely clanky takze kdybych s tim chtela stavit nekolikl tydny prace tak bych to nak zvladla ale otazka je chci-li? Cte to vubec nekdo ty stary veci? Takovy existencni a existencialni otazky si ted chudaci bloggeri kladou...LOL

    OdpovědětVymazat
  11. hele pro to konvertovani to musi mit specificky nazev ten file (tj ne jiny nez wp.xml)? a je tam limit pro velikost toho fajlu?mne to rika ze "Input WordPress document is not valid XML!!"

    OdpovědětVymazat
  12. moje xml ma 7.22 MB (7,577,753 bytes)

    OdpovědětVymazat
  13. kdyz vymenim ty uvozovky tak mi to hlasi chybu hned v prvnim radku, ty uvozovky se maj zamenit opravdu v celym dokumentu?

    OdpovědětVymazat
  14. protoze ty pises u ty vymeny znaku ze maji byt vymeneny jen v nazvu clanku

    OdpovědětVymazat
  15. spoon, je potreba dodrzet to obaleni mezerema, cili nahrazovat treba " ' " a ne jen "'". Jinak se to cely rozbije

    OdpovědětVymazat
  16. obaleni mezerama tam mam. Hele jeste otazku: tu zalohu wp.xml muzu z bloguje.cz stahnout nekolikrat (pokud jsem si tu prvni rekneme rozkopala a neudelala si zalohu) nebo je po stazeni obsah uz vymazan/vyzvednut? Udelala jsem si dnes novou zalohu (po te co admin ohlasil updejty) protoze jsem ty opravy jeste nemela vsechny provedeny a po importu na wp to preneslo jen ten posledni clanek. Dik

    OdpovědětVymazat
    Odpovědi
    1. Spoon, to je divny, melo by to stahovat komplet - zkus i tu druhou zalohu urcenou primo pro wordpress.

      Vymazat
    2. P.S. - asi se na ty znaky <>'" muzes vykaslat, mly by stacit ty ampersandy, ty se pouzivaj nejvic. A hlavne to opravdu dela brikule jen v nadpisech clanku, v textech je to, zrejme, v poradku. Ten puvodni XML export je fakt priserne zmrsenej...

      Vymazat
  17. dik tato tuleni, zkousela jsem prave tu druhou zalohu pro wp. Nekolikrat. Ale furt mi sel jen ten posledni clanek. Ale bylo to objemove podobne velky ty prvni zaloze tak nevim. Pak jsem si rikala ze jsem nedostatecne vyprazdnila obsah toho novyho wp blogu (pretoze vse se zdalo bejt vymazany) a vytvorila jsem novej :). Ale pockam si jeste na tu zalohu na blogspot a pak se prenesu tam....a pak jeste pracuju na variante 3) vlastni domene...

    OdpovědětVymazat
    Odpovědi
    1. Tak zkus jeste tu puvodni zalohu. A pripadne holt napis adminovi - neodpovi ti hned, ale zda se, ze se neflaka a neni to zadnej hajzlik jako ti Lesikari :)

      Pod var. 3 si predstavujes svuj vlastni webhosting s vlastnim systemem? Na to bych se vykaslal, je to spousta prace a hlavne - vlastni domena se da presmerovat snad na vsechny blogsystemy, kde mas vsechno uz pripraveny :) Problemem jsou furt ty obrazky, ale i to by slo zaridit tak, aby se tahaly jako z tvoji domeny.

      Vymazat
    2. nakonec fungovala varianta novyho accountu na worldpressu + nova zaloha (ten par tejdnu starej account uz jsem asi nejak kompromitovala desitkama pokusu o import a naslednym mazanim obsahu). V ramci varianty 3 uz jsem si zaplatila vlastni domenu a jednam o cene webhostingu a prenosu dat a rozchozeni systemu (ty obrazky asi ozelim, ted jsem koukala co ta zaloha obsahuje za hruzy a asi lepsi to z webu sundat a zacit jinak a lepe) ale vysledek je jeste ve hvezdach, taky je mozna varianta 4 a to: zabalit to kompletne a texty si nechat nekde v externi pameti pocitace na stary kolena az budu mit cas na to se jima probirat a pripadne s nima neco dal delat.

      Vymazat
    3. Supr! :) Pripadne muzes stahnout statickou zalohu staryho blogu a odkazat na ni na novym jako to mam ja (sice jsem prenesl prispevky a upravil obrazky, ale z nostalgie po starym designu to tu necham :))

      Vymazat
    4. Jeden blog jsem zkonvertovala a importovala v pohodě, s málo obsahem, ale na Škebli mám zálohu přes 9 mega, konverze skrze http://wordpress2blogger.appspot.com/ mi hlásí chybu.

      Přemýšlím - fungovalo by, kdybych to rozsekala třeba na 10 kusů obsahu s toutéž hlavičkou a poimportovala postupně?

      Původně jsem si říkala, že to zarchivuju u Denta a prdím na psaní, ale nakonec mi to nedá, nerada se vzdávám...

      Vymazat
    5. A otázka taky zní, jak to co nasekat co nejefektivnějc, páč při 140 tisících řádků je nějaký označování a mazání ručně docela pakárna...

      Vymazat
    6. Ano, rozsekat a nalejt to postupne je samozrejme mozny. Jak to rozsekat "rozumne", to nevim - dulezity je jen, aby to melo spravnou hlavicku a paticku a prispevky nebyly usekany v pulce...

      Vymazat
  18. Já doufala, že mi poradíš nějakej zlepšovák... :-) Teda pod dojmem slov v úvodu - "...az se najde nekdo, kdo narazi, at mi da vedet, domluvime se, jak to zkusit prekecat :))"
    :-)

    Tak třeba kdybys na něco přišel... Sekat budu až zas někdy o nějakým víkendu. :-)
    Případně dík předem.

    OdpovědětVymazat
    Odpovědi
    1. Nojo, jak to zkusit, to uz vime - je potreba to rozsekat. Ale jednoduchej postup fakt neznam. Mozna nejakej chytrej editor, ale o zadnym takovym nevim. Treba do toho vikendu na neco prijdu, ale slibit to nemuzu :)

      Vymazat
    2. Tak, povedlo se s pomocí jednoho ajtý známého. Ale jak to udělal, to se mě neptej(te), dostala jsem už zkovertovaný výsledek, pac a pusu asi až jindy. :-)Ale prostě to nějak jde, přes nějaké jiné prográmky.
      Takže hurá.
      Tátovi Tulňovi i tak díky. :-)

      Vymazat
  19. Zdravím trosečníky .-) Já jsem někde na 116000 řádku a Convert se mi od rána seká, tak nevím.... už "jen" cca 40000 řádků a potom těch 10 MB přesunout , ale píšou,žeto vezme jen do 1 MB , tak bude asi problém,co? .....

    OdpovědětVymazat
  20. Velké díky za tento článek!
    Konvert se mi sice nepodařil, x-krát jsem propadla totální beznaději a kdovíčemu ještě..., nicméně v okamžiku, kdy jsem to chtěla zabalit se mi povedla aspoň první část (ze šesti) - buď ta nová, třetí, záloha z bloguje už ten konvert nepotřebuje, či jsem to konvertovala tolikrát, že už systém rezignoval???
    Teda nechci to zakřiknout, i to je úspěch - a pustila jsem se do toho jen díky tomuto článku!!! :-))

    Hm, tak jsem to zrovna zakřikla, další část už zas pro změnu nejde...

    OdpovědětVymazat

Mazat komentáře nehodlám, výjimky však tvoří vulgární a off-topic komentáře!