Subscrever RSS Subscrever RSS
Edição de 30-04-2024
  • Edição Actual
  • Jornal Online

    Arquivo: Edição de 15-02-2008

    SECÇÃO: Tecnologias


    Quer conhecer e colaborar com o Projecto Gutenberg? (2)

    O Projecto Gutenberg pretende a disponibilização do maior número possível de livros electrónicos grátis, ao alcance do maior número de pessoas.

    DIREITOS AUTORAIS

    O primeiro passo para o envio de um livro é a confirmação de que o Project Gutenberg pode, legalmente, distribuir o livro electrónico. Visite o nosso Como-Fazer: Direitos Autorais (http://www.gutenberg.org/wiki/PT-PG) para mais detalhes. O Project Gutenberg não distribuirá nenhum livro electrónico sem confirmar o seu estado quanto aos direitos autorais.

    FORMATOS DOS FICHEIROS

    Sempre que possível, o Project Gutenberg distribui uma versão em texto puro do livro electrónico. Outros formatos, tais como HTML, XML, RTF e outros, também são bem-vindos mas o texto simples é o “denominador mínimo comum”. Nós damos ênfase à inclusão do texto puro devido à sua longevidade: o Project Gutenberg inclui inúmeros ficheiros de textos que têm 20-30 anos. Nessa altura, apareceram e desapareceram dúzias de formatos amplamente utilizados. O texto puro é acessível a partir de todos os computadores e também é uma garantia contra uma obsolescência futura.

    A insistência no texto puro pode ser um problema para recolher livros electrónicos (veja abaixo) mas é ainda um firme requisito. As únicas situações em que o Project Gutenberg distribui um livro electrónico sem uma versão de texto puro são quando o texto puro é impossível ou impraticável — por exemplo, para os nossos filmes ou ficheiros de áudio MP3, e para algumas das nossas obras matemáticas.

    CRIAR UM LIVRO ELECTRÓNICO

    Transformar um livro físico num livro electrónico é uma forma maravilhosa de preservar o livro e torná-lo mais largamente disponível. Historicamente, a criação de livros electrónicos foi conseguida por uma única pessoa transcrevendo o livro físico, uma página de cada vez. Esta técnica ainda funciona, claro, e, por vezes, é necessária (por exemplo, se o livro está danificado ou é extremamente frágil).

    Actualmente, o cenário mais provável é que o livro físico seja digitalizado. O Distributed Proofreaders (http://www.pgdp.net/c/) corre digitalizações de páginas a grande velocidade, mas os voluntários têm de retalhar a lombada do livro para o digitalizarem. Os indivíduos terão, muito provavelmente, um digitalizador de mesa, que é mais lento mas não implica que se danifique o livro.

    Depois de se digitalizar, é utilizado um programa de OCR (Reconhecimento Óptico de Caracteres – “Optical Character Recognition”) para transformar as páginas num texto que você pode editar. Os digitalizadores vêm com programas de OCR e é comum uma exactidão superior a 99%. Corrigir esses cerca de 1% de erros é a parte que consome mais tempo. A revisão é o processo de comparar o resultado do OCR com o livro físico, corrigindo os problemas.

    Assim que o OCR estiver revisto, precisa de ser formatado num livro electrónico completo. Por vezes, a formatação é feita continuamente durante a revisão. Para criar um livro electrónico em texto puro, use ferramentas como o GutCheck (http://sourceforge.net/projects/gutcheck) para procurar erros de OCR comuns e problemas de formatação. Os livros electrónicos em texto puro devem ter linhas com 72 caracteres e saltar uma linha entre os parágrafos, sem avanços. Para muitos mais detalhes, vejas as PergFreq (http://www.gutenberg.org/wiki/Category:PT_PergFreq).

    Os outros formatos são por vezes facilmente produzidos a partir do programa de OCR ou podem ser criados utilizando um processador de texto ou outra ferramenta. Para o HTML, o Project Gutenberg insiste no HTML válido (através do Validador, em http://validator.w3.org). Isto pode ser bastante estimulante se você utilizar ferramentas automatizadas para criar HTML – é melhor seguir os conselhos de outros voluntários do Project Gutenberg e escolher cuidadosamente o seu método de autenticação do HTML.

    Estará óptimo se mantiver imagens digitalizadas no seu HTML (ou mesmo com um texto simples, que pode ser comprimido juntamente com as suas imagens). As imagens devem ser recortadas e guardadas nos formatos PNG, GIF ou JPEG. Não tente manter a maior resolução possível – para o HTML, normalmente, partimos do princípio que 96 DPI (pontos por polegada, “dots per inch”) a 256 cores, que é uma resolução “média”.

    Geralmente, o livro electrónico deve estar todo num só ficheiro (ou num ficheiro, mais ficheiros de imagem). Isto facilita a sua visualização como um todo.

    COLHEITA

    Existem muitos livros electrónicos na Internet e noutros lugares que não fazem parte da colecção do Project Gutenberg. Os envios desses livros são bem-vindos! Os dois desafios principais, como mencionado acima, são os direitos autorais e a formatação. Os direitos autorais são, frequentemente, um desafio porque um livro electrónico colhido pode não ter detalhes suficientes para realizarmos uma clarificação de direitos autorais. Nesses casos, o livro electrónico precisa de ser comparado com um livro físico conhecidamente em domínio público – ver mais em PT-PG Como-Fazer Confirmação de Direitos Autorais (http://www.gutenberg.org/wiki/PT-PG_Como-Fazer_Confirma% C3%A7%C3%A3o_de_Direitos_Autorais).

    De uma forma semelhante, a formatação pode ser um problema devido à falta de texto puro, HTML inválido ou a muitos ficheiros que precisam de ser reunidos num único texto ou HTML.

    Se o estado de domínio público de um livro electrónico for confirmado, isso significa que o livro electrónico está livre para qualquer utilização.

    (Para nos certificarmos que o livro electrónico consiste apenas em materiais em domínio público, todas as marcas registadas ou outros itens novos – como gráficos recentemente criados – devem ser removidos). O procedimento para um item colhido da internet é que o Project Gutenberg (ou você, o voluntário do Project Gutenberg) procurará informações da fonte do livro electrónico para o incluir na colecção. Se nos for dada permissão, podemos também incluir uma linha de créditos, como uma atribuição e uma URL.

    Nos casos em que não seja recebida resposta, ou a permissão não nos seja concedida, o livro electrónico pode, ainda assim, ser utilizado sem a atribuição (desde que esteja confirmado que está em domínio público pela equipa de direitos autorais do Project Gutenberg). Pedir permissão é uma cortesia, como o é incluir uma linha de créditos. Mas se a permissão não aparecer, o estado de domínio público do item proíbe qualquer limitação ao seu uso, seja pela pessoa ou pela organização que criou o item, seja pelos distribuidores subsequentes.

    Claro, a discussão nesta secção também se refere a pessoas que criaram livros electrónicos para outros fins ou projectos. Também damos as boas-vindas a estes envios!

    PARA ONDE ENVIAR

    UM LIVRO ELECTRÓNICO

    Visite a nossa página de envios (http://upload.pglaf.org/) para enviar o(s) ficheiro(s) do livro electrónico. Será levado para os dados da clarificação de direitos autorais recebidos da equipa de direitos autorais. Se tiver dificuldades com o formulário ou precisar de utilizar um método alternativo para o envio (como FTP ou correio electrónico), envie uma mensagem para a equipa de envios (subs_@_pglaf.org) para organizar os detalhes.

    Por: PROJECT GUTENBERG

     

    Outras Notícias

    · A memória do rato

     

    este espaço pode ser seu Este espaço pode ser seu Este espaço pode ser seu
    © 2005 A Voz de Ermesinde - Produzido por ardina.com, um produto da Dom Digital.
    Comentários sobre o site: [email protected].