sexta-feira, 2 de março de 2012

A REPRESENTAÇÃO DESCRITIVA NÃO É ÚNICA, MAS ONIX

A REPRESENTAÇÃO DESCRITIVA NÃO É ÚNICA, MAS ONIX
Fernando Modesto


A REPRESENTAÇÃO DESCRITIVA NÃO É ÚNICA, MAS ONIX
[Março/2012]

Estudantes de Biblioteconomia e Bibliotecários devem ter ouvido o termo “Web Semântica”. A ideia de dar sentido à linguagem escrita e falada (conteúdo qualitativo), que embora entendida por nós humanos, os computadores não compreendem. É, portanto, baseada numa informação estruturada, inequívoca. Deve possibilitar ao software (semântico) reconhecer o conceito, relacionamento, partes e o todo do que é composta a informação.



Assim, o sistema pode realizar inferências e tirar conclusões. Um dos objetivos básicos, da web semântica é a reutilização de dados. Imaginemos um ambiente na qual os recursos on-line são disponibilizados, e que possibilita aos sistemas fazerem uso dos recursos de formas distintas e quando necessário. Isto é denominado de “computação em nuvem” ou “web aberta”. Estas possibilidades começam a transformar todos os setores, e inclusive a atividade bibliotecária. (SIEGEL, 2010).



Este texto não é uma discussão sobre web semântica, apenas um comentário sobre normas influenciadas pelo conceito semântico, e também por padrões tradicionais de catalogação bibliográfica, como os pertinentes à representação descritiva. Um processo de descrever coisas em seu aspecto de forma e conteúdo. Imaginemos, agora, o cenário da web semântica, no qual os próprios livros se catalogassem. O que nós bibliotecários faríamos? Não, não é o caso de suicídio em massa de catalogadores, ao contrário.



Os livros sempre apresentaram muita informação e, atualmente, há um crescimento no universo das informações bibliográficas. É um fenômeno que impacta a maneira como as pessoas escrevem, compram e usam essas publicações. Há um novo modelo de negócio que depende da representação descritiva (não é piada ou pegadinha. Leia até o final.).



Segundo Siegel, nos Estados Unidos há cerca de quatro milhões de livros à venda (se uma biblioteca comprar tudo irá faltar catalogador para o tratamento, ufa!). Todos os anos, as editoras lançam, em média, no mercado, 300 mil novos títulos em língua Inglesa. O mercado editorial movimenta cerca de $40 bilhões de dólares, e continua crescendo (no setor de tratamento técnico, o movimento de materiais também é crescente, mas os salários dos catalogadores, oh!).



Assim, tornou-se essencial para esse mercado – em amplitude global – uma padronização no fluxo de informação da sua produção, para melhor comunicação e transação entre editoras, distribuidores e livrarias, e até mesmo bibliotecas. As editoras podem, agora, elaborarem a lista de seus livros em formato ONIX. Desta forma, um programa pode diagramar, automaticamente, a lista em um catálogo para impressão, ou distribuir as informações (no formato) para a cadeia de comercialização de outros países. Até mesmo os mecanismos de busca, na internet, podem encontrar um arquivo ONIX e identificar a descrição de livros que contenha.



As editoras não adotam apenas o número internacional normalizado para livros (ISBN), mas o formato ONline Information eXchange (ONIX). O padrão internacional para representar e comunicar as informações bibliográficas eletronicamente. Não está limitado à determinada linguagem ou características específicas do comércio livreiro. É aplicado para publicações impressas e eletrônicas no mercado dos Estados Unidos, Canadá, França, Alemanha, Holanda, Itália, Espanha, Noruega, Finlândia, Suécia, Bélgica, Rússia, Coreia do Sul, Japão, EUA, Canadá, Austrália, China, Egito, Reino Unido.



No Brasil, por iniciativa da Câmara Brasileira do Livro [CBL], teve início há cerca de dois anos o projeto de instituir este padrão para a descrição dos livros publicados, no país. A intenção é que as editoras passem a atualizar informações completas sobre os seus catálogos, seguindo as mesmas diretrizes, de forma eletrônica e instantânea aos interessados no mercado. O projeto foi denominado: Cadastro Nacional do Livro [CANAL]. A plataforma recebeu investimentos de R$ 197 mil por parte da CBL. É dito que o aporte financeiro é significativo, comparável ao custo do Censo do Livro, que é realizado anualmente com recursos da CBL e do Snel (Sindicato dos editores). Em fevereiro de 2012, o CANAL entrou em período de testes com a participação de editoras selecionadas, entre elas a Saraiva, Gente e Loyola. É esperado o lançamento oficial no segundo semestre do ano corrente. É desconhecida a participação de entidades biblioteconômicas brasileiras na discussão do CANAL, como ocorreu com o padrão ONIX, em outros países. De forma simplificada, o CANAL se estrutura em um software espanhol (DILVE) configurado por uma série de campos (metadados) a serem alimentados com os dados de cada livro. As editoras devem preencher no mínimo 17 campos obrigatórios [como título e ISBN], mas há 170 campos que podem ser utilizados. O que permite montar uma base de dados refinada – há a possibilidade de incluir a capa e trechos da obra, por exemplo.



Quanto ao padrão ONIX (original), o mesmo é baseado em XML para inserção dos metadados do livro. A EDItEUR é a instituição que fornece as especificações e orientação sobre a implementação do ONIX. O seu uso é gratuito. O padrão não é um banco de dados, mas uma estrutura etiquetada para a comunicação de dados. Muitos membros da EDItEUR desenvolveram sistemas próprios que implementam o padrão. Importante realçar, que a EDItEUR tem por missão trabalhar, também em benefício das bibliotecas (nacionais, acadêmicas, especializadas, públicas, e consórcios de bibliotecas). Como isto se dará na adoção brasileira do padrão, só se saberá posteriormente.



O formato teve várias versões. Desde a versão 1.0, publicada em 2000, até a versão 2.0, publicada em 2001. Sempre tem havido uma série de revisões para adicionar funcionalidades. A versão atual é a 3.0, publicada em abril de 2009, e que sofreu correções entre 2010 e 2012. As implementações na versão são contínuas. Saliente-se que os produtos digitais são tratados como um elemento "central" na cobertura do ONIX.



Historicamente, ONIX para livros foi o primeiro formato, adotado dentro da família de normas ONIX. Outras normas incluem ONIX para seriados e ONIX para licenças de publicações, bem como formatos mais especializados de metadados associados com o registro de identificadores como: Digital Object Identifier (DOI), International Standard Text Code (ISTC), International Standard Name Identifier (ISNI), International Standard Music Number (ISMN), além do International Standard Book Number (ISBN), e International Standard Serial Number (ISSN).



Algumas das vantagens do formato são:



§ Eliminação de redundâncias na descrição.

§ Produtos digitais descritos de forma completa e consistente, com bases estabelecidas para o desenvolvimento de novos formatos de produtos e pacotes de conteúdo.

§ Editores podem utilizar no seu material de divulgação para promover as vendas.

§ Para usuários que trabalham nos mercados internacionais, em especial da língua inglesa, permite que o status de um produto em diferentes mercados seja descrito mais claramente e com precisão.

§ Com a introdução da norma ISTC, uma publicação pode ser relacionada a uma “obra” pai, para identificar grupos de diferentes manifestações da mesma, ou de textos derivados de uma origem comum – é o conceito do FRBR.



Para algumas pessoas, o ONIX para livros parece demasiadamente grande e complexo. No entanto, é complexo porque os produtos que descreve são complexos, e porque o formato tem de satisfazer as diferentes necessidades da Cadeia de abastecimento, em diferentes mercados editoriais.



ONIX e as normas catalográficas



A RDA, desenvolvida como o novo padrão de descrição de recursos e acesso para ambiente digital, está fundamentada nas Regras de Catalogação Anglo-Americana (AACR), apesar de orientada para uso principalmente em bibliotecas, almeja, também, um alinhamento com padrões de metadados utilizados por comunidades relacionadas (arquivos, museus e editoras), além de fornecer um ajuste com as tecnologias emergentes de banco de dados. Um aspecto da RDA é a descrição de elementos relacionados ao conteúdo e suporte de um recurso, e que auxilia os usuários na identificação e seleção de recursos para atender suas necessidades de informação (forma de conteúdo, assunto, características físicas do suporte, formatação e codificação das informações, etc).



O código ONIX de Livros é um conjunto padrão de códigos a serem utilizados nos metadados, incluindo elementos que descrevem o conteúdo do produto e seus suportes.



Discussões realizadas em 2005, entre a Joint Steering Committee for Revision of AACR (Comissão de Acompanhamento Conjunta de Revisão do AACR – JSC, atualmente denominada como Comissão de Acompanhamento Conjunta para o Desenvolvimento da RDA) e os representantes da indústria editorial, no Reino Unido, identificaram a categorização de recursos por conteúdo e suporte como sendo de mútuo interesse e passível de iniciativas de cooperação. Iniciativas conjuntas posteriores foram financiadas pelas organizações que patrocinam o desenvolvimento da RDA e do ONIX, com o apoio adicional da British Library. O objetivo básico foi desenvolver um quadro categorizado de recursos em todos os meios que possam apoiar as necessidades das bibliotecas e da indústria editorial, além de facilitar a transferência e utilização de dados da descrição de recursos entre as duas comunidades.



Experiências aplicadas, desta compatibilização, entre padrões podem ser visualizadas nos serviços para os editores, da OCLC (Online Computer Library Center). Títulos de metadados em formato ONIX são aceitos, e enriquecidos pela mineração do banco de dados WorldCat, e entregue em arquivo ONIX, pronto para uso em sistemas de comercialização e de marketing. A figura 1 ilustra o fluxo desta cooperação no intercâmbio de registros bibliográficos entre formatos – ONIX e MARC.




Figura 1 – Fluxo do intercâmbio de registros ONIX e MARC no serviço da OCLC

Fonte: http://publishers.oclc.org/en/metadata/default.htm



Já a compatibilidade de registro entre ONIX e MARC é mostrada no exemplo seguinte, extraído dos exemplos de Carol J. Godby. Do registro ONIX é mostrado apenas os elementos usados para descrição bibliográfica para relaçar a compatibilidade com o registro de MARC. O texto em vermelho representa os valores dos dados que podem ser copiados do ONIX para o MARC, no máximo com pequenas alterações. Caso das etiquetas: e que são copiadas literalmente para os campos correspondentes no MARC.



O texto em azul indica diferenças puramente estruturais entre os dois registros. A estrutura do ONIX é imposta por um esquema XML. Os registros MARC podem ser realizados em mais de um formulário, estruturado na norma ISO-2709. Lendo da esquerda para a direita, existem três tipos de sinalização em um registro MARC: um campo, que a exceção do líder, é nomeado por um número de três dígitos, variando de 001 a 999; codificado por conjunto de dois indicadores, que contêm instruções para manipulação dos dados associados ao campo; e um conjunto de subcampos que contêm os valores dos dados.



O texto verde representa os dados codificados que não são copiados, mas mapeados. Às vezes, o mapeamento é só uma correspondência de um código ONIX para o MARC. Por exemplo, ISBN-13 é representado no ONIX como um com um 3. No MARC é representado no campo 024, cujo primeiro valor do indicador também é 3. Outras relações não são tão simples. Por exemplo, a etiqueta ONIX tem o valor BB para a descrição de um livro impresso, mas a mesma informação não tem correspondência de transporte no registro MARC, dentro de um conjunto de valores existente no campos: líder 008, ou 300.



Exemplo de Registro em ONIX




0892962844

03
9780892962846


BB
<br /> <TitleType>01</TitleType><br /> <TitleText>McBain's Ladies</TitleText><br />

A01
Hunter, Evan


02

Policewomen-- Fiction


320

02
Mysterious Press

19880501



Leader 00000 jm a22000005 4500

008 g eng

020 0892962844

024 3# 9780892962846

100 $a Hunter, Evan

245 $a McBain’s ladies

260 $b Mysterious Press $d 1988

300 $a 320 p.

650 #2 $a Policewomen -- Fiction



As semelhanças do ONIX e MARC são evidentes. Ambos os padrões servem para conectar as obras publicadas com o seu público. Mas eles não são derivados um do outro. Os padrões são estruturalmente e semanticamente diferentes porque oferecem suporte a diferentes necessidades e comunidades. Porém, o exemplo utilizado tenta mostrar que eles se assemelham e devem ser compartilháveis entre as comunidades das bibliotecas e das editoras.



A popularização do ONIX, no campo editorial, abre boas perspectivas para a atividade bibliotecária de catalogar e intercambiar informações bibliográficas. Temos uma expertise que pode ser muito útil aos editores. Ademais, há uma nova camada de recursos agregáveis aos conceitos biblioteconômicos.



Enfim, a catalogação continua em moda.



Indicação de leituras:


Godby, Carol J. Mapping ONIX to MARC. Dublin, Ohio: Online Computer Library Center, 2010. Disponível em: http://www.oclc.org/research/publications/library/2010/2010-14.pdf


Siegel, David. Pull: o futuro da Internet e o impacto da Web Semântica em seus negócios. Rio de Janeiro: Elsevier, 2010.




Exemplo do Registro em MARC



Sobre Fernando Modesto


Bibliotecário e Mestre pela PUC-Campinas, Doutor em Comunicações pela ECA/USP e Professor do departamento de Biblioteconomia e Documentação da ECA/USP.

Nenhum comentário: