CC-BY-SA from https://commons.wikimedia.org/wiki/File:HumanChromosomesChromomycinA3.jpg

Notícia na Agência Fapesp fala sobre a The Global Alliance for Genomics and Health (GA4GH) e sua integrante brasileira, a Brazilian Initiative on Precision Medicine (BIPMed).

“Os primeiros esforços de compartilhamento têm permitido desenvolver tratamento para doenças raras e algumas formas de câncer. Porém, tal benefício só atingirá toda a população quando médicos e pesquisadores puderem acessar e comparar dados de milhões de indivíduos”

O consórcio internacional foi fundado em 2013 com esse propósito: ajudar pacientes, pesquisadores e médicos a obter avanços científicos por meio do compartilhamento responsável de dados. Um dos projetos mais conhecidos do grupo é o Beacon, no qual as instituições associadas – entre elas a BIPMed – oferecem um serviço online capaz de responder perguntas simples (como respostas apenas “sim” ou “não”) e que não violem informações consideradas sigilosas. São consultas como: “Você tem em seu banco algum genoma com um ‘A’ na posição 100.735 no cromossomo 3?”

“É preciso mudar a cultura acadêmica, amenizar o sentimento de posse que os pesquisadores têm com os dados. Na maioria das vezes eles são fruto de pesquisas financiadas com dinheiro público e contam com material doado por outras pessoas. Os pesquisadores financiados pelo NIH, por exemplo, têm a obrigação de tornar seus resultados públicos, sob pena de não serem mais financiados. A mesma política poderia ser adotada pelas agências de fomento do Brasil”, comentou Cendes.

Veja a notícia ínteira na Agência Fapesp.

De <http://www.sibi.usp.br/>

A Dra. Elisabeth Dudziak, professora titular na UNIP e chefe técnica no Sistema Integrado de Bibliotecas da USP (SIBi-USP), publicou um excelente artigo no site do SIBi reclamando o fato: dados de Pesquisa agora devem ser armazenados e citados.

No artigo ela explica parte do histórico dessa mudança – é sempre difícil cobrir tudo, achei que ficou só faltando contar da importância do pioneirismo da PLoS nesse âmbito, – comenta sobre a licença CC0, – e os procedimentos e repositórios disponíveis para se publicar dados de pesquisa.

Uma notícia muito bem vinda, considerando que no encontro do grupo Ciência Aberta em 2013, com participação do SIBi-USP apresentando os repositórios institucionais de artigos, discutimos justamente a importância das bibliotecas na publicação de dados de pesquisa!

logoOpenCon2016

Está aberto até 11 de julho o processo de seleção para participar da edição 2016 da OpenCon, que acontecerá na capital dos Estados Unidos, Washington DC, entre 12 e 14 de novembro de 2016 (veja aqui o anúncio oficial). A OpenCon é uma conferência internacional promovida anualmente pela SPARC e pela Right to Research Coalition, voltada para estudantes, professores, bibliotecários e outros profissionais acadêmicos em início de carreira interessados em acesso aberto, educação aberta e dados abertos.

Seguindo o modelo dos anos anteriores, a programação da OpenCon 2016 começará com dois dias de palestras,  mesas-redondas e oficinas, sendo o terceiro e último dia dedicado a um treinamento em advocacy seguido da oportunidade de se reunir com legisladores, representantes de ONGs e outros tomadores de decisão. Entre os palestrantes das duas primeiras conferências da OpenCon estão Jimmy Wales (cofundador da Wikipedia), Mike Eisen (cofundador da PLOS), e Julia Reda (membro do Parlamento Europeu).

A fim de que os custos de uma viagem internacional não sejam um obstáculo à participação de estudantes e jovens profissionais, os organizadores da OpenCon procuram oferecer bolsas totais e parciais à maioria dos participantes. Por isso, para participar da conferência é preciso passar por um processo de seleção, que procura também garantir a diversidade de participantes em termos de carreira, interesses, geografia, gênero etc. As inscrições devem ser feitas pelo site http://www.opencon2016.org/apply

Também é possível participar à distância do evento pela OpenCon Live. Além da transmissão em tempo real das sessões, os organizadores oferecem uma teleconferência para que os participantes remotos possam conversar entre si e liderar oficinas e discussões virtuais. Já é possível se inscrever para a OpenCon Live no site www.opencon2016.org/opencon_2016_live (essa inscrição não afeta o processo de seleção para o evento presencial).

Para alcançar ainda mais pessoas, a Right to Research Coalition e a SPARC estimulam a realização de eventos satélite, que podem ser promovidos por qualquer pessoa/organização, em qualquer escala. No ano passado, o encontro nacional do Grupo de Trabalho em Ciência Aberta foi realizado em parceria com a OpenCon. Quem se interessar em promover um evento satélite pode obter mais informações no site www.opencon2016.org/satellite.

Mais do que uma conferência, a OpenCon é uma plataforma onde pessoas interessadas na ciência aberta podem encontrar colaboradores. Algumas das iniciativas lideradas por membros da comunidade OpenCon incluem as ferramentas Open Access Button e Dissem.in, o site WhyOpenResearch?, as organizações Open Access Nepal, Open Access Nigeria, Open Access Sudan, Open Access Academy e OOOCanada Research Network, o Open Research Glossary, e pelo menos um artigo científico investigando os impactos sociais, econômicos e acadêmicos da publicação em acesso aberto.

Para mais informações, visite o site www.opencon2016.org, siga a OpenCon no Twitter (@Open_Con ou #opencon) e Facebook, e/ou leia relatos sobre as edições anteriores, em 2014, pela Renata Aquino, e em 2015, por mim. É possível assistir a vídeos das edições anteriores do evento e ter acesso a outros recursos no site www.opencon2016.org/resources.

Imagem do blog do projeto Content Mine
O projeto ContentMine, plataforma concebida por Peter Murray-Rust para facilitar pesquisas baseadas na análise em larga escala da literatura acadêmica, tendo por objetivo automatizar a extração em larga escala de fatos contidos em artigos científicos, está oferecendo apoio intelectual e financeiro para projetos que possam fazer uso de sua versão de desenvolvimento e assim, além de se beneficiar dela, também ajudem a desenvolvê-la.

Mais informações neste post no blog do projeto, inscrições vão até 3 de junho!

Ni!

Encaminho abaixo a mensagem da organização Committee on Data of the International Council for Science:

Logo a partir do site http://www.codata.org/

Dear colleagues,

Deadlines are approaching for two related but separate training opportunities in research data science convened by CODATA.  For both events funding is available, prioritised for participants from less economically developed countries.  We are particularly keen to attract:
– female researchers with an interest in developing their data skills;
– participants who are interested in convening similar training activities in their own institution.

Please circulate the information below widely in your networks!

CODATA-RDA School of Research Data Science at the International Centre for Theoretical Physics in Trieste, 1-12 August 2016
 
Deadline 18 April: http://indico.ictp.it/event/7658/

Contemporary research – particularly when addressing the most significant, transdisciplinary research challenges – cannot be done effectively without a range of skills relating to data. This includes the principles and practice of Open Science and research data management and curation, the use of a range of data platforms and infrastructures, large scale analysis, statistics, visualisation and modelling techniques, software development and annotation and more. We define ‘Research Data Science’ as the ensemble of these skills.

More information on the activity to establish a series of such schools for Research Data Science: http://www.codata.org/working-groups/research-data-science-summer-schools

CODATA International Training Workshop in Big Data for Science, Beijing, 4-17 July 

Deadline 18 April: http://www.codata.org/news/105/62/CODATA-International-Training-Workshop-in-Big-Data-for-Science-Beijing-4-17-July
 
In today’s data-rich world, streams of digital data are being generated from science facilities and myriad sensors (telescopes, video cameras, traffic monitors, magnetic resonance imaging machines, and biological and chemical sensors monitoring the environment etc).  Combined with the increasing ability for large-scale storage, communication and analysis, the Data Revolution presents major opportunities for science.  The Science International Accord on ‘Open Data in a Big Data World’ highlights the most important issues to be addressed if these benefits are to be realized.  These include the Open Data imperative, the need to maintain the scientific self-correction and the ethical constraints which must be respected.  Equally important is the need for open global participation in the benefits of the Data Revolution.  Systemic capacity building and targeted training in Big Data and data science are essential if this is to be achieved in countries with emerging or developing economies.

More information on the workshop, associated activities and the application procedure: http://www.codata.org/news/105/62/CODATA-International-Training-Workshop-in-Big-Data-for-Science-Beijing-4-17-July

With very best wishes,

Simon.
___________________________

DATA SCIENCE TRAINING OPPORTUNITIES – FUNDING AVAILABLE – DEADLINE APPROACHING!

CODATA-RDA School of Research Data Science, hosted at the International Centre of Theoretical Physics, Trieste, Italy, 1-12 August 2016: http://indico.ictp.it/event/7658/ – FUNDING AVAILABLE – DEADLINE 18 April 2016.

CODATA International Training Workshop in Big Data for Science, Beijing, 4-17 July http://www.codata.org/news/105/62/CODATA-International-Training-Workshop-in-Big-Data-for-Science-Beijing-4-17-July – FINDING AVAILABLE – DEADLINE 18 April 2016
___________________________
Dr Simon Hodson | Executive Director CODATA | http://www.codata.org

por  Diganta Talukdar em https://www.flickr.com/photos/nagaon/4453432565/in/photostream/

Num artigo recente na PlosONE, um grupo brasileiro aponta para uma transição de fase para um estado de baixo volume, associada à gestão do Sistema Cantareira.

Numa ação interessante, o diretor da SABESP manifestou-se através do próprio sistema de comentários da PlosONE, onde já obteve uma resposta dos autores.

O interessante aqui é como, além de publicarem num periódico de acesso aberto com políticas para publicação de dados e código, na resposta às críticas os autores ainda enfatizam a importância da disponibilidade livre dos dados e do código, e a escolha de softwares livres também na infraestrutura da análise, associando essas características à verificabilidade dessa infraestrutura e reprodutibilidade dos seus resultados.

Por tantos motivos, é muito bom estar ocorrendo esse debate!

.~´

DSC01698

Nos dias 10 e 11 de Setembro irá acontecer na USP um workshop da Software Carpentry no qual será apresentado boas práticas de programação em Python e controle de versão com Git.

Informações detalhadas sobre o workshop e inscrições encontram-se disponíveis em http://rgaiacs.github.io/2015-09-10-usp/.

computer

Algo que todas as ciências compartilha é a necessidade de analisar dados que podem ser de um experimento químico com mercúrio como também de experimento envolvendo um circuito elétrico, dados socioeconômicos da população ribeirinha ou respostas de um questionário sobre nossos políticos. Infelizmente, os cursos de graduação e pós-graduação não costumam dar muita importância em ensinar boas práticas para análise de dados aos seus alunos e muito menos em como fazer a análise de dados sob os paradigmas da ciência aberta.

Software Carpentry é um grupo de voluntários interessados em mudar essa realidade e para isso eles ministram workshops onde apresentam ferramentas livres para analise de dados, como por exemplo R e Python, assim como boas práticas.

students2

Nesse primeiro semestre, a Software Carpentry realizou um workshop na Universidade Federal do Paraná, outro na Universidade Estadual de Campinas e um terceiro na Universidade Federal do Ceará. Os participantes dos três workshop gostaram bastante do conteúdo apresentado.

Se você tiver interesse em um workshop da Software Carpentry, entre em contato.

students

A primeira foto foi tirada por Renato Augusto Corrêa dos Santos e as demais por Eric Lopes.

Dynix/Skylarstrickland/CC0

Há algumas semanas encontrei este texto: “Library catalog metadata: Open licensing or public domain?” de autoria de Timothy Vollmer (com contribuições de MacKenzie Smith, Paul Keller e Diane Peters), de 14 de Agosto de 2012 no Blog da Creative Commons. Embora escrito já há algum tempo, o tema é extremamente pertinente e muito atual. Assim, pela escassez deste tipo de discussão aqui no Brasil, sobretudo quanto a mercantilização dos Catálogos de Bibliotecas através de “serviços de descoberta (web-scale discovery services)“, segue uma tradução do post, como forma de contribuição para novas discussões sobre um tema tão importante para as bibliotecas e centros de informação.

Não esqueça, o conteúdo deste site, salvo indicação em contrário, está licenciado sob a licença Licença Creative Commons

TRADUÇÃO de: Library catalog metadata: Open licensing or public domain? Timothy Vollmer, August 14th, 2012

Conforme relatado, há algumas semanas, a OCLC recomendou que suas bibliotecas membros, passem a adotar a licença Open Data Commons Attribution (ODC-BY) quando elas compartilharem seus dados de catálogos bibliográficos on-line. A recomendação de utilizar uma licença aberta como ODC-BY é um passo positivo para a OCLC porque ajuda a comunicar com antecedência os direitos e responsabilidades para os potenciais utilizadores de metadados bibliográficos de catálogos bibliográficos. Mas a decisão da OCLC em recomendar uma via de licenciamento – em oposição à liberação dos metadados bibliográficos para domínio público – levanta preocupações que justificam mais discussão.

A OCLC diz que tornar os dados bibliográficos derivados do WorldCat disponíveis sob uma licença aberta como ODC-BY está em conformidade com as normas de sua comunidade. No entanto, há outras opções que são igualmente compatíveis. A Biblioteca de Harvard, por exemplo, desenvolveu um acordo com a OCLC no início deste ano que faz com que seus metadados sejam disponíveis sob a Dedicação ao Domínio Público (CC0). Isto significa que Harvard cedeu todo o seu Copyright e os direitos conexos a esses dados, permitindo assim a mais ampla variedade de reutilização. Mesmo que coloque esta informação em domínio público, Harvard solicita que os usuários forneçam a atribuição à fonte como uma boa prática, sem fazer da atribuição uma exigência juridicamente vinculativa, através de uma licença.

Há boas razões para se confiar em normas comunitárias para atribuição de metadados em vez de exigir como condição um acordo de licenciamento. A exigência de apresentação de atribuição através de um contrato como ODC-BY não é bem adequada para um mundo onde os dados são combinados e remixados a partir de múltiplas fontes e sob uma variedade de licenças e outras restrições de uso. Por exemplo, a comunidade de bibliotecas está experimentando, com as novas tecnologias, os dados linkados (Linked Data) como um meio de obter maior valor das suas décadas de investimento coletivo em catalogação de dados. E estamos felizes em ver que a OCLC lançou um milhão de registros do WorldCat contendo 80 milhões de triplas de dados vinculados em RDF. No entanto, acreditamos que a exigência de atribuição como condição de licenciamento introduz uma complexidade que irá torná-lo tecnicamente difícil – se não impossível – para que os usuários estejam em conformidade.

Depois, há a questão de como vincular corretamente a informação de atribuição para uma pequena porção de dados (por exemplo, um único campo, subcampo ou tripla). A OCLC tem prestativamente fornecido orientações sobre a atribuição para os seus dados linkados , mas como será este trabalho para as bibliotecas membros que seguem as recomendações da OCLC para adotar a licença ODC-BY quando publicam seus próprios dados? Coleções de dados linkados de Biblioteca muitas vezes são derivados de pequenos subconjuntos de muitas coleções grandes e recombinados com novos relacionamentos, potencialmente exigindo atribuições separadas para cada elemento de dado. No caso dos dados publicados da OCLC, imagine que um usuário faz o download do arquivo da OCLC contendo 80 milhões de triplas de dados linkados, extrai os que ele está interessado e, em seguida, linka-os aos seus próprios dados de catálogo para criar um novo conjunto de dados linkados. As orientações para os dados do WorldCat incluem a opção de considerar uma URI WorldCat como atribuição suficiente, mas como seria esse trabalho para os próprios dados bibliográficos da biblioteca ou para dados adicionais, extraídos de fontes não-OCLC? As orientações não incluem recomendações sobre como as bibliotecas devam implementar os seus próprios dados de tal forma que reutilizadores possam cumprir com os requisitos de atribuição impostas pela licença ODC-BY. As normas da comunidade e as melhores práticas para a reutilização de dados linkados de bibliotecas não estão ainda bem definidas, por isso confiá-los em um contexto de licença juridicamente vinculativa é preocupante.

Outra questão que surge é sobre o âmbito da licença ODC-BY com seu foco em direitos europeus de banco de dados, além dos direitos de autor – direitos de banco de dados que não se aplicam nos EUA e que abrangem o banco de dados em sua totalidade, mas não o seu conteúdo, tornando incerto se ela pode ser aplicada a um simples arquivo de dados bibliográficos. E a questão de saber se o copyright se aplica a todos os dados bibliográficos, dada a sua natureza essencialmente factual é duvidoso, e pode variar dependendo da jurisdição legal. Enquanto a licença ODC-BY pode fazer bom senso para a OCLC para aplicar ao WorldCat em si, seria uma escolha questionável para uma biblioteca dos EUA que está procurando compartilhar alguns de seus dados de catálogo como um arquivo para download.

Além disso, pôr a maioria dos países fora da União Europeia – incluindo os Estados Unidos – não conceder proteção a bancos de dados não-criativos, a licença ODC-BY não funciona, à exceção, na melhor das hipóteses, como uma restrição contratual sobre aqueles downloads diretamente do site do licenciante. Portanto, esta restrição que não se baseia em qualquer direito de propriedade exclusiva subjacente, é improvável vincular reutilizadores que não obtém os dados diretamente do provedor de dados original. A ausência de um contrato vinculativo juntamente com a falta de qualquer propriedade subjacente à direita significa que licenciadores podem se surpreender ao saber que eles não têm uma solução forte e eficaz, como uma reivindicação de infração contra os utilizadores. Esta é uma preocupação existente na Licença de Banco de Dados Open, licença irmã de ODC-BY, que tem a mesma característica de projeto “contrato + licença”. Assim, a licença em muitos casos simplesmente não irá proteger a biblioteca que compartilhou os dados, ou OCLC, da maneira que eles esperam.

Outra preocupação mais geral sobre o uso de uma licença para compartilhar metadados bibliográficos tem a ver com a sua viabilidade técnica. Isto é evidente na Model Language que OCLC recomenda, que inclui links para a WCRR Política de Uso dos registros (WorldCat Direitos e Responsabilidades), as normas da comunidade e um FAQ. Seguindo estes links leva os leitores as páginas com ainda mais informações sobre os requisitos esperados para os membros e não-membros. A preocupação não é tanto a opacidade das regras, mas que eles podem tornar-se ligados a um grande número de registros que não têm nada a ver com a OCLC. Por exemplo, muitos membros só podem ter começado muito recentemente o reuso de registros da OCLC, ainda que na Model Language não é feita qualquer distinção entre registros OCLC e registos não OCLC de origem, mais uma vez, porque não há nenhuma solução técnica viável para diferenciar entre estes. O resultado: A atribuição é (erradamente) dada a OCLC para toda a base de dados, e um grande número de princípios OCLC ligados aos conteúdos completos do banco de dados das bibliotecas. Enquanto o ODC-BY e WCRR podem muito bem ser instrumentos bem-intencionados para transformar os dados do WorldCat em “recursos comuns” para os membros da OCLC, ele certamente não tem as soluções técnicas para demarcar onde começa e termina, potencialmente resultando em confusão e overreaching de requisitos para os que tentam cumprir. Fundamentalmente, isso levanta a questão de saber se os registros de biblioteca não devem ser apenas bens públicos liberados para o domínio público.

Por todas as razões acima expostas, instituições culturais, incluindo a British Library, Europeana, a Biblioteca da Universidade de Michigan, Harvard e outras adotaram a Dedicação ao Domínio Público (CC0) para a publicação de seus dados de catálogo online. A partir disso, vemos que uma abordagem verdadeiramente normativa para a comunidade de bibliotecas seria a Dedicação ao Domínio Público, como a CC0, juntamente com os pedidos para fornecer atribuição à fonte (por exemplo OCLC) na medida do possível. Tal abordagem seria maximizar a experimentação e inovação com os dados de catalogação, de acordo com a missão e os valores da comunidade de bibliotecas, respeitando o investimento da OCLC e a comunidade de bibliotecas neste valioso recurso.