Ni!

Hoje aconteceu na cidade do Rio de Janeiro o workshop Desafios contemporâneos à colaboração em Ciência e Tecnologia, organizado pelas professoras Sarita Albagli e Maria Lucia Maciel do Liinc e PPGCI (IBICT/UFRJ).

Além das conferências de Jesús Mena-Chalco, sobre e-science, e Lea Velho, sobre internacionalização, eu apresentei uma palestra sobre ciência aberta com um título curioso.

Infelizmente a luz acabou logo no início do evento e tivemos de transformar o workshop numa aula pública no restaurante desativado do CBPF, portanto não temos gravação para compartilhar.

Mas a página da minha apresentação está acessível na Wikiversidade:

Ciência Aberta – organizando a ciência no Brasil pra 200 milhões de cientistas

Abraços!

ale

Este post é uma tradução desse outro post (CC-BY) originalmente publicado por Greg Wilson em 17/10/2013 no blog da Software Carpentry. Texto entre colchetes são notas de tradução.

Como parte do “Mozilla Summit” algumas semanas atrás, John Jensen apresentou um relatório sobre a saúde da “open web”. Os detalhes são fascinantes e foram sumarizados no gráfico abaixo mostrando as várias camadas de abertura da qual dependemos. Eu [Greg] vou reproduzí-lo na esquerda e sumarizar minha visão como está a ciência aberta nas mesmas camadas na direita:

Open Web
Escolha
e
Controle
do Usuário
Atividade
Social
Atividade
Economia
Confiança
Diversidade de serviço
Inovação
Liberdade de conteúdo
Interoperabilidade
Acesso
Ciência Aberta
Escolha
e
Controle
do Usuário
Atividade
Social
Atividade
Economica
Confiança
Diversidade de serviço
Inovação
Liberade de Conteúdo
Interoperabilidade
Acesso

Aqui encontra-se a análise de Jensen (baseada em toneladas de dados) e a minha [do Greg] (que é basicamente minha opinião) de baixo para cima:

Área Open Web   Ciência Aberta
Acesso Um terço da população mundial possui acesso regular à internet e apenas 2% vivem em países que estão quase completamente desconectados (Cuba, Iran, Coreia do Norte e Uzbequistão). Por outro lado, apenas um décimo dos norte-americanos com necessidades especias utilizam a internet. Embora a grande disponiblidade de acesso à internet em países desenvolvidos e de um crescimento em outros países, até mesmo o mais bem financiado grupo de pesquisa ainda encontra barreiras para acessar conteúdo e dados. Pessoas estão trabalhando em todos os níveis para mudar isso, mas existe muito a ser feito.
Interoperabilidade Navegadores web modernos são bastante compatíveis entre si. Serviços voltados para cientístas normalmente não falam entre si.
Liberade de Conteúdo Covernos estão tentando controlar quem pode ver o que, mas ainda temos certa grande liberdade para ler, ver e dizer o que queremos.

(Nota: quando questionado, Jensen disse que este camada talvez devesse ser amarela para refletir o aparecimento de jardins cercados e DRM.)
Até pesquisadores renomados e instituições capitalizadas [não encontrei uma boa tradução para “well-funded”] possuem dificuldade em acessar a pesquisa de seus pares devido a barreiras financeiras e outros bloqueios utilizados pelos fornecedores de conteúdo.
Inovação A maior parte ocorreu na área de aparelhos celulares e tablets nos últimos anos. Inúmeras idéias e serviços tem aparecidos nos últimos anos, e não existe sinais de que isso irá dinimuir.
Diversidade de
Serviços
Diversidade diminui quando você aproxima-se do topo da pilha. Por exemplo, a web não é controlada por uma única operadora de rede, mas utilizamos apenas três sistemas operacionais e apenas o serviço de redes sociais e ferramentas de busca são dominados por apenas uma empresa cada um dos serviços. Diversidade dinimui próximo do fim da cadeia de publicação: existem muito mais pontos para coleta de dados do que arquivos usáveis, e algumas poucas grandes empresas possuem a mesma força na área de publicação que Apple, Google, Facebook, e Amazon possuem na web.
Escolha e
Contrle
do Usuário
Várias opções para desktop, mas celulares e tablets são dominados pelo Safari e produtos relacionados com a versão móvel do Firefox possuem apenas uma pequena fatia do mercado. Mais importante, talvez, os usuários não possuem controle de suas identidades: Facebook, Google e Yahoo! possuem. Ninguém domina a ciência na web da mesma forma que Apple, Google e Facebook dominam a web de uma forma geral.
Atividade
Social
De um lado, Facebook consome 83% do tempo “social” online dos usuários. Do outro lado, legislações como SOPA e PIPA são repetidamente derrubadas. O lado social da ciência ainda é fortemente conduzida presencialmente em conferências.
Atividade
Economica
Comércio online possui a maior fatia, seguido por propaganda que constitui algo próximo de um monopólio. O mercado de coisas científicas como a revisão/publicação de artigos é hoje quase que totalmente conduzida pela internet, mas a maioria dos softwares e serviços são caixas pretas controlada por um número reduzido de empresas.
Confiança A internet e mídia social é a 25ª das 25 indústrias nas quais as pessoas confiam, depois de bancos e linhas aéreas. A grande maioria dos cientistas confiam no trabalho dos seus pares, o que é evidenciado pelo fato de que eles não requistam o compartilhamento de dados e códigos para o processo de revisão ao qual são submetidos. Isso não é necessariamente uma boa coisa…

Esta análise mostra porque tantas pessoas trabalhando em prol da ciência aberta estão focadas em mudanças institucionais para abrir o conteúdo, e mudanças técnicas para que as ferramentas hoje presente possam conversar uma com as outras. Nossa missão para os próximos anos é ajudar os cientistas a adquirirem as habilidades e ferramentas necessárias para fazerem seu trabalho.

Sobre o acesso aberto

No dia 07 desse mês, Devon Hanel publicou um post em opensource.com com o título Open access to scientific knowledge has reached its tipping point no qual divulga um estudo europeu que chegou a conclusão de que daqui a dois anos 50% de todas as publicações acadêmicas estaram disponíveis gratuitamente (das publicações de 2011 50% já encontram-se disponíveis gratuitamente).

Uma informação importante desse estudo é que “a maioria de artigos de alguns campos como biomedicina, biologia, matemática e estatísticas encontram-se gratuitamente disponíveis e que o acesso aberto é mais limitado nas ciências sociais, humanidades, ciências aplicadas, engenharia e tecnologia” (tradução e adaptação do autor de trecho do estudo europeu).

O estudo também envolveu o Brasil que aprensentou 63% do artigos investigados em “acesso aberto” devido, em parte, a grande contribuição da Scielo.

Sobre a reprodutibilidade

“A reprodutibilidade de uma experiência científica é uma das condições que permitem incluir no processo de progresso do conhecimento científico as observações realizadas durante a experiência. Essa condição origina-se no princípio de que não se pode tirar conclusões senão de um evento bem descrito, que aconteceu várias vezes, provocado por pessoas distintas. Essa condição permite se livrar de efeitos aleatórios que podem afetar os resultados, de erros de julgamento ou de manipulações por parte dos cientistas.” (Wikipédia)

Ao passarmos a utilizar mais e mais ferramentas computacionais nos experimentos científicos um dos requisitos para a reprodutibilidade do experimento é a disponibilidade do código fonte dos programas utilizados e dos dados de entrada. Infelizmente, hoje, essa não é uma prática comum e foi tema de uma thread na lista de discursão da Software Carpentry sobre qual seria a porcentagem de artigos científicos que disponibilizam os
códigos fontes e dados de entrada.

Essa quantidade vai variar de área para área (algumas áreas da computação disponibilizam os códigos mais que outras) mas as estimativas mais animadoras em quase todos os emais era de ~5% e as mais “realistas” de <1%.

Atualização em 04/11/2013: Os slides das apresentações encontram-se disponíveis no slideshare.

Nota 1: Este post corresponde a uma tradução do anterior que encontra-se em inglês.

Nota 2: As opiniões presentes neste post não representam o grupo de trabalho em Ciência Aberta como um todo.

Nos dias 6 e 7 de Outubro ocorreu a 4ª CONFOA (Conferência Luso-Brasileira sobre Acesso Aberto) a partir da qual eu gostaria de levantar alguns tópicos para debate.

image20131008_0003

Na conferência tivemos várias apresentações sobre acesso aberto, dados abertos, repositórios institucionais, direitos autorais, …, mas eu consigo lembrar de apenas DUAS apresentações cujos slides estava marcados com uma licença aberta:

  • Disponibilidad en acesso aberto de la produccion científica de los países de África lusófona. Martins Fernando Cuambe and Gema Bueno de la Fuente.
  • Cross-Ref, DOI (Digital Object Identifier) e serviços: Estudo comparativo luso-brasileiro. Edilson Damasio.

Então slides é um tipo de conteúdo que não deve ser aberto?

Nas recomendações de Budapest encontramos a definição abaixo para acesso aberto (tradução e destaque pelo autor deste post):

Por “acesso aberto” da literatura científica revisada por pares, nós entendemos que ela encontra-se livremente disponível ao público da internet, permitindo qualquer um lê-lo, baixá-lo, copiá-lo, distribuí-lo imprimí-lo, fazer busca nele, ou criar links para o texto completo desses artigos, utilizá-lo para produção de índices, passá-lo como informação/entrada para um programa de computador (software), ou utilizá-lo para qualquer outro propósito legal, sem barreiras financeiras, legais ou técnicas outras que não inseparáveis da obtenção do acesso da internet. A única restrição para a reprodução e distribuição, e a única regra para o direito autoral neste domínio, de ser dar ao autor o controle sobre a integridade do seu trabalho e o direito de ser adequadamente reconhecido e citado.

No Brasil, muitos chamam de documentos “abertos” aqueles que podemos apenas ler. Na minha opinião, devemos começar a chamar esse tipo de documento apenas de acesso grátis para evitar mal entendidos.

Também no Brasil, as pessoas gostam de utilizar as licenças Creative Commons com a condição de uso não comercial. Pedi ao senhor Marcos Alves de Souza do Ministério da Cultura por uma definição de uso comercial e ele disse que tal não existe. Desta forma e na minha opinição, uma vez que não consiguimos fazer uma diferença clara do que é uso comercial devemos parar de utilizar a condição de uso não comercial das licenças Creative Commons pois o uso dessa restrição apenas atrasa o processo de inovação como foi dito várias vezes na conferência.

Updated in 2013/11/04: Some of the slides are available at slideshare.

Note: The opinion in this post aren’t from the work group in Open Science as a hole.

In 6th and 7th of October happen the 4th CONFOA (Portuguese-Brazilian conference about Open Access) from it I would like to rise three topics to debate.

image20131008_0003

The conference have lots of presentations about open access, open data, institutional repository, copyright, …, but I can only remember of TWO presentations that the slides have a free license:

  • Disponibilidad en acesso aberto de la produccion científica de los países de África lusófona. Martins Fernando Cuambe and Gema Bueno de la Fuente.
  • Cross-Ref, DOI (Digital Object Identifier) e serviços: Estudo comparativo luso-brasileiro. Edilson Damasio.

So presentations are one type of content that should NOT be open?

From the Budapest recommendations we have the following definition of open access (boldface from the author of this post):

By “open access” to [peer-reviewed research literature], we mean its free availability on the public internet, permitting any users to read, download, copy, distribute, print, search, or link to the full texts of these articles, crawl them for indexing, pass them as data to software, or use them for any other lawful purpose, without financial, legal, or technical barrier other than those inseparable from gaining access to the internet itself. The only constraint on reproduction and distribution, and the only role for copyright in this domains, should be to give authors control over the integrity of their work and the right to be properly acknowledged and cited.

In Brazil, most of the called “open” documents ONLY permit the reading. In my humble opinion, we must start calling this type of document “free beer” access to avoid misunderstandings.

Here in Brazil, people like to use the Creative Commons licenses with the noncommercial clause. I asked Marcos Alves de Souza from brazilian’s ‘Ministério da Cultura” for a definition of noncommercial use and he say that it doesn’t exist. So in my humble opinion, once we can’t make clear what is noncommercial we should stop using the noncommercial clause of Creative Commons because the use of this clause only slow the innovation as say, many times, in the conference.

Ni!

Ei-los abaixo, finalmente, os vídeos do encontro do grupo de trabalho realizado em junho de 2013!

Um agradecimento coletivo ao Raniere, que cortou, editou e fez os letreiros, à equipe de audiovisual do IFUSP, pela transmissão ao vivo e captura, e ao Thiandré, que nos mostrou como limpar o som ruidoso.

Para uma descrição resumida do que foi o encontro, quem eram os palestrantes e o que cada um apresentou, vejam o post Relato do encontro nacional do grupo de trabalho – dia 7.

Abertura do encontro

Educação aberta

Debora Sebriam (REA-BR)

Tel Amiel (Unicamp)

Debate

Ferramentas científicas abertas

Rafael Pezzi (UFRGS)

Fabio Kon (CCSL/IME-USP)

Daniel Tavares (LNLS)

Acesso aberto

Cameron Neylon (PLOS)

Sueli Ferreira (USP)

Marcos C. Visoli (Embrapa)
A partir dos 33:50 do vídeo anterior (Sueli Ferreira)

Ciência cidadã

Atila Iamarino (Science Blogs Brasil)

Artur Rozestraten (USP)

Eduardo Oda (GHC)

Dados científicos abertos

Henrique Andrade (Wikimedia Foundation)

Jorge Machado (USP)

Ewout ter Haar (USP)

Robson Souza (USP)

Wikipesquisas

Alexandre Hannud Abdo (USP)

Nota: Este post é baseado no post “Publishing scientific software matters”, de Gaël Varoquaux, e no artigo “Publishing scientific software matters”, de Christophe Pradal, Gaël Varoquaux e Has Peter Langtangen.

Cada vez mais softwares estão desempenhando papel fundamental na produção científica, seja transformando um modelo teórico em simulações, controlando experimentos ou filtrando dados para serem analisados. Infelizmente algumas coisas precisam ser melhoradas.

O primeiro problema é que várias pesquisas e softwares são construídos em cima de ferramentas proprietárias como Matlab e Mathematica, de forma que só é possível revisar a pesquisa e o software após adquirir tais ferramentas.

Uma das vantagens de modelar um problema matematicamente é que assim fica mais fácil procurar por uma forma de resolvê-lo que já tenha sido bastante estudada. De forma semelhante, seria interessante poder utilizar um software já existente ou adaptá-lo para resolver o problema desejado devido a sua estrutura matemática. Infelizmente grande maioria dos softwares são escritos direcionados para problemas específicos de forma que reusá-lo não é uma tarefa fácil, o que é o segundo problema.

O terceiro problema é que muitos dos softwares não encontram-se disponíveis publicamente sendo necessário contactar os autores para adquirir uma cópia quando eles podem fornecê-la. Quando falamos de ciência estamos indiretamente falando de resultados reprodutíveis, então “se não é aberto e verificável por outros, então não é ciência, ou engenharia, ou qualquer que seja o nome pelo qual você chama o que fazemos” (tradução literal de citação anônima presente em “The scientific method in practice: reproducibility in the computational sciences ” de V. Stodden.)

Espero que em breve consigamos resolver estes problemas.

Foto por SF BRit
Foto por SF BRit (CC-BY)

Um movimento como o pela Ciência Aberta, assim como a própria ciência, não se faz de instituições, mas antes por uma reorganização de valores e práticas individuais que irão repercutir nessas estruturas.

Contudo, o surgimento de organizações dedicadas a promover tendências de abertura no desenvolvimento científico reflete a maturidade e consolidação do esforço que os indivíduos contribuem para tal.

Assim, é bastante significativo que neste ano tivemos, além da formação deste próprio grupo de trabalho, o estabelecimento de instituições dedicadas a estudar e avançar tendências da ciência aberta no Brasil.

Este post – para o qual atualizações, complementos e correções são bem vindos (deixe um comentário!) – busca apresentá-las.

  • Também em agosto, a Itaipú Binacional e seu Parque Tecnológico inauguraram o Centro Latino-Americano de Tecnologias Abertas, que irá pesquisar e desenvolver soluções inovadoras que utilizem exclusivamente tecnologias livres.

Além disso, na próxima semana teremos o segundo encontro, na Cidade do Cabo, para a formação de uma rede internacional de pesquisa em Ciência Aberta para o Desenvolvimento, financiada pelo IDRC-Canadá, que até o final do ano deverá abrir um edital para projetos e ativar parcerias com outras instituições.

E por agora, para concluir, compartilho uma animação fractal produzida por LandscapeWindscreen, para acompanhar uma das Variações Goldberg de J.S. Bach, numa gravação interpretada pela pianista Kimiko Ishizaka como parte do projeto Open Goldberg Variations, que através de financiamento coletivo produziu gravações e partituras em domínio público da obra.

Ni!Screenshot from 2013-08-06 04:57:38

Foi publicado na última edição da revista Computação Brasil (CB), editada pela Sociedade Brasileira de Computação, o artigo Ciência aberta, dados abertos e código aberto de autoria do Prof. Fabio Kon.

Nele se descreve os desvios e fragilidades de algumas formas ainda atuais de lidarmos com o conhecimento científico, destacando a importância de as atualizarmos utilizando as tecnologias disponíveis, para abrir o conhecimento a todos e produzir, assim, uma ciência mais colaborativa e competitiva, mais verificável, reprodutível e responsável.

Acesse o artigo ou baixe a revista na íntegra.

Screenshot from 2013-08-06 04:55:30

E, aproveitando o assunto, hoje ocorre a inauguração do prédio do Centro de Competência em Software Livre no IME-USP!

Abraço!

(Imagens acima extraídas da revista.)