Como fazer um backup público deste fórum?

Eu tenho escrito bastante por aqui e, por isso, tenho receio de perder o conteúdo dessas postagens em alguma situação hipotética de falha nos servidores. Conversei com o Armando (um dos responsáveis pelo fórum Fiozera) e ele me garantiu que o fórum tem backup automático sendo feito “na nuvem”. Isso é bom. Mas na minha opinião não é suficiente.

Eu gosto da idéia de “backup público”. Ou seja, uma forma de deixar uma cópia de segurança (e frequentemente atualizada) dos dados disponível ao público para que qualquer um seja capaz de resgatar as informações e não apenas os administradores. Todo o conteúdo aqui está licenciado sob os termos da licença Creative Commons By SA e a minha intenção é garantir que o conteúdo se perpetue e seja preservado para a posteridade.

Eu tenho o hábito de fazer backup público das minhas postagens de blogs neste repositório do GitHub:

No caso do meu blogue em inglês hospedado em http://mamedev.emulab.it/fsanches/ sempre após fazer uma nova postagem eu abro o painel do Wordpress e exporto todo o conteúdo em formato XML. E então atualizo esse XML no repositório de backup do github. Essa é uma boa solução pois é simples e rápida de fazer. E como eu não tenho acesso administrativo no servidor mamedev.emulab.it, isso me dá a paz de espírito para dormir tranquilo sabendo que não irei perder o conteúdo que produzi.

Já aqui no Fiozera (que roda uma instância do Discourse), eu não tenho acesso ainda a uma ferramenta para conseguir o mesmo resultado, ou algo similar. Até tentei fazer backups na WaybackMachine do Internet Archive, mas tropecei num bug do Discourse:

Eu tenho copiado manualmente o HTML das postagens, mas isso é bem trabalhoso e não toma conta de copiar também as imagens. Fico imaginando se haveria alguma forma de automatizar esse tipo de tarefa. Talvez com um pequeno script de crawling. Ou talvez com um script de Greasemonkey…

Alguém tem alguma idéia de como facilitar esse processo ?

1 curtida

Tem um botão para exportar seus posts em https://forum.fiozera.com.br/my/activity

1 curtida

Tem esse outro post que estava usando de referência investigativa:
https://meta.discourse.org/t/archive-an-old-forum-in-place-to-start-a-new-discourse-forum/13433

O backup feito hoje cobre arquivos enviados e toda a base de dados, são salvos num S3 privado.

Eu ainda busco uma solução. Eu tenho feito backup manual das minhas postagens no github. Tentei usar o link my/activity que o Falco sugeriu e, de fato, ajuda um pouco. É salvo um arquivo CSV comprimido dentro de um pacote GZ. Os dados do CSV são todas as minhas postagens. Mas não vem junto as imagens. Então eu ainda terei que manualmente saltar todas as imagens que usei nas minhas publicações.

Outro problema é que aparentemente só são inclusas as minhas postagens, mas não as mensagens que outras pessoas escreveram nas minhas threads…