Biblioteca Brasiliana Guita e José Mindlin

A matéria abaixo foi publicada no site Gizmodo, e achei interessante a ponto de reproduzir aqui no blog. Uma iniciativa como essa é excelente, mas ainda é pouco diante das necessidades monstruosas que o Brasil tem em termos de educação e conhecimento.
Dentro da Universidade de São Paulo, a Biblioteca Brasiliana Guita e José Mindlin foi criada em 2005. O prédio construído especialmente para receber o acervo do Dr. José Mindlin, que tem mais de 40 mil volumes, só ficou pronto no começo de 2013, mas a digitalização de seu acervo começou bem antes: em 2008, foi formada a equipe que seria responsável pelo projeto da Brasiliana USP, a versão digital da Mindlin, que foi ao ar em julho de 2009. A empreitada incluía também a criação de uma plataforma de software para disponibilizar o conteúdo, além de providenciar a parte de hardware, como scanners, servidores e storage. Fomos conhecer de perto o processo de digitalização de tantos volumes raros e históricos.
A Plataforma Corisco, nome do software open source da biblioteca, foi criada a partir do DSpace, projeto também de código aberto do Instituto de Tecnologia de Massachusetts, o conhecido MIT, com recursos da HP para custear o projeto. “É um software extremamente bem sucedido, com talvez centenas de instituições ao redor do mundo utilizando-o. Ele é escrito em Java, portanto tem uma tecnologia moderna voltada para a Web”, diz Edson Satoshi Gomi, coordenador de tecnologia da informação da Biblioteca Brasiliana.
Gomi, que também é professor do Departamento de Engenharia da Computação da Escola Politécnica da USP, explica o que a Plataforma Corisco tem a mais em relação ao DSpace puro. “O que nós fizemos adicionalmente foi colocar algumas camadas que não existem no original. A primeira camada que colocamos foi uma interface web, que permite uma customização da cara, e o segundo componente que agregamos foi o que chamamos de visualizador de itens do acervo, sejam eles livros, imagens ou mapas.”
Outras duas camadas ainda serão implementadas: uma ferramenta para gerir todo o processo de digitalização e registrar metadados e outra para a preservação digital das imagens em alta resolução. “O volume de imagens que estamos produzindo é relativamente grande e o que é mais caro nesse processo todo é este trabalho de digitalização. Portanto, julgamos importante manter este conjunto de imagens de uma forma íntegra que não se perca isso ao longo dos anos.”
Maria Bonita e suas irmãs
E este volume de imagens é realmente enorme: a Maria Bonita e suas irmãs, apelido dado pela equipe da biblioteca às máquinas fabricadas pela canadense Kirtas, são equipadas com câmeras Canon de 21 megapixels – os modelos da linha Kabis têm duas câmeras em x, cada uma virada para uma página do livro; já o modelo Skyview, voltado para a digitalização de mapas, cartazes e jornais, tem apenas uma, que se desloca em dois eixos para varrer toda a extensão do material. Cada câmera é ligada num computador que, por sua vez, é ligado a um servidor. As imagens aparecem em tempo real no monitor do scanner.
Cada página “bruta”, por assim dizer, é uma fotografia com definição considerável (ainda que a imagem antes do recorte inclua também uma parte considerável do suporte em que o livro é colocado). “As imagens que nossos scanners produzem”, explica Gomi, “são imagens de altíssima resolução. Tipicamente, cada imagem pode ocupar uma dezena de megabytes de tamanho. Se multiplicarmos isso pela quantidade de páginas, não é incomum um livro ter vários gigabytes de tamanho.”
O livro é posto aberto numa mesa e o scanner vira as páginas através de uma espécie de aspirador de pó, que gruda as folhas por sucção e as vira. O processo é automático, mas tem que ser acompanhado por um funcionário, que ajusta a posição do livro vez ou outra, para as imagens não ficarem tortas. A velocidade máxima é de 2.500 páginas por hora.
20 terabytes de raridades
Engana-se quem pensa que é arriscado colocar um livro raro numa máquina dessas. “Existe uma preocupação nossa com a integridade dos livros”, diz Gomi. “Mas é importante chamar a atenção de que o fato de termos um livro raro não significa que ele está em mal estado ou fragilizado, muito pelo contrário. Muitas vezes, livros antigos estão em estado tão bom que são relativamente robustos.”
A digitalização é só o começo de todo o processo. O que se segue é bem trabalhoso: o processo de recorte e tratamento da imagem. Segundo Gomi, já foram digitalizados 20 terabytes de material, mas nem tudo está disponível para acesso justamente porque falta esta etapa, que é um gargalo no fluxo de trabalho.
O objetivo é reduzir ao máximo o tamanho do arquivo e, ao mesmo tempo, garantir a legibilidade. Por isso, os arquivos em .pdf, cada um deles com cerca de 10MB, podem não ter exatamente a mesma cor das páginas do livro original, além de o contraste ser muito mais marcante.
A última etapa é o reconhecimento dos caracteres. Se você já sofreu com um programa de OCR, sabe o quanto é difícil. Aqui o problema é ainda maior, como explica Gomi. “O OCR é ainda, digamos, um problema em aberto. Para textos impressos com caracteres modernos, ele reconhece com uma certa precisão, mas nós estamos aqui tratando de textos antigos, além de muitos manuscritos.”
Paralelamente, são cadastrados os metadados de cada material, padronizados segundo o esquema Dublin Core, o mesmo do DSpace.
Quando está tudo pronto, o livro fica disponível no site da Brasiliana Digital. Ele pode ser visualizado na própria página sem a necessidade de plug-ins, para facilitar o uso escolar, ou baixado – é um arquivo .pdf, então talvez não fique muito bom no seu e-reader.
Aberto para todos
Mas a disponibilização do acervo para o público não é o único produto do projeto: o código-fonte da Plataforma Corisco está aberto para quem quiser usar. O Instituto Paulo Freire, por exemplo, já adotou o sistema. Mas open source não quer dizer de graça: já foram gastos mais de R$ 3 milhões no projeto, com recursos de entidades como o BNDES e a Fapesp.
Uma parte considerável desse valor foi para bolsas de iniciação científica, mestrado e doutorado. A Plataforma Corisco, além de tudo, é um projeto de pesquisa: para chegar onde está hoje, foram precisos erros e acertos. A primeira versão da edição original do livro de Hans Staden, por exemplo, foi disponibilizada com 1 gigabyte de tamanho (!) e isso só foi percebido porque um professor do grupo de desenvolvedores não conseguia baixá-lo.
A postura de ir resolvendo cada um dos problemas encontrados parece ser intrínseca à formação de bibliotecas digitais, como explica Gomi. “Não faz muito sentido se criar um padrão de como se constrói uma biblioteca digital. Certamente, há a necessidade de se ter uma liberdade nesse sentido, porque os tipos de acervo que podem ser construídos são muito variados. Podemos ter bibliotecas digitais de livros, de músicas, até de arquitetura, porque hoje é possível fazer digitalização 3D.”
Outro ponto a ser notado é o respeito aos direitos autorais: os mais de 3 mil itens disponíveis que estão em domínio público. Segundo Gomi, são mais de 1500 acessos únicos por dia e visitantes de vários países, inclusive daqueles que não falam português. Definitivamente, a Brasiliana USP leva o acervo do Dr. José Mindlin para muito mais longe do que uma biblioteca física.

Encontrando e usando imagens online: dicas e direitos autorais

Excelente artigo para quem trabalha com relações públicas ou comunicação em geral:

You might have written a great essay or article, but it’s still incomplete without an image. Images have the ability tell a story, and they form an integral part of the many articles we write.

The Web is a trove of terrific images, but not all of them are free. The challenge lies in finding the right images at the right price; generally they are classified as premium, “freemium,” or free images.

Before we dig into the best resources for free images, here are the classifications you should know about from Google:

Labeled for reuse

Your results will include only images labeled with a license that allows you to copy and/or modify the image in ways specified in the license.

Labeled for commercial reuse

Your results will include only images labeled with a license that allows you to copy the image for commercial purposes, in ways specified in the license.

Labeled for reuse with modification

Your results will include only images labeled with a license that allows you to copy and modify the image in ways specified in the license.

Labeled for commercial reuse with modification

Your results will include only images labeled with a license that allows you to copy the image for commercial purposes and modify it in ways specified in the license.

Here is another great resource on copyright guidelines.

As for places to find images:

1. Google Images

Google Images is one of the best places to search for compelling images. For free images, look for the small gear icon on the right side of the screen and select “Advanced Search.” Select the correct image use type from the blue sign that says “Usage Rights,” and you’re set.

Warning: Do not just grab an image from the search result; the images are protected by strict copyrights.

2. Flickr Creative Commons

To pick up free images from Flickr, put the image subject in the search string and click the “Advanced Search” on the upper right corner of the screen. On the Advanced Search page, select “Creative Commons” at the bottom.

3. PhotoPin

One of the easier ways to find free images from Creative Commons is to search Photopin. It finds images with all the attribution license details, making it easier for you to plug in the image to your content.

4. FreeDigitalPhotos.net

This site has one of the best stocks of images. Free images are lower in size, apt for blogs, but if you want bigger photos, they are offered at a premium. It is often my go-to site.

5. Create your own

Yes, this could one of your best ways to get free images. I often end up making my own images when I am unable to find a suitable image on the Web. With cameras on most phones now, it is pretty much easy to click a snap and use it on your content. You can even add some beautiful text over it using image editing tools like PicMonkey.

This post originally appeared on social media consultant Malhar Barai’s blog.

Por um Facebook com menos gatinhos e mais conteúdo

Eu tinha guardado essa matéria da Folha de São Paulo de novembro de 2011, e “achei” numa limpeza de final de semana.

Aproveito para colocar aqui no blog, pois acho uma idéia muito boa – especialmente porque ando farto do Facebook, com todos aqueles gatos, mensagens de auto-ajuda idiotas etc…

Segue a matéria na íntegra, com grifos meus:

Engenheiros fazem ‘tira-dúvidas’ avançado

Criação coletiva de respostas é diferencial desenvolvido pelos fundadores do site Ledface, de ex-alunos da Unicamp

MARIANA BARBOSA
DE SÃO PAULO

Sites de perguntas e respostas, como o do Yahoo!, são tão antigos quanto a própria internet. Mas eles estão ficando mais sofisticados, com cara de rede social e softwares inteligentes que ajudam a melhorar as respostas.

Na esteira do sucesso do Quora, site de perguntas e respostas de ex-executivos do Facebook avaliado em US$ 300 milhões pelo Goldman Sachs, acaba de entrar no ar o brasileiro Ledface.

Desenvolvido por um grupo de engenheiros formados na Unicamp a partir de doutrinas liberais da websfera como software livre, cocriação e anonimato consciente, o site está em fase beta (pré-lançamento em linguagem web).

Em apenas um mês, e sem divulgação, contabiliza 2.900 usuários cadastrados, sendo 52% do Brasil. O site pode ser acessado em português, inglês ou nas duas línguas ao mesmo tempo. Já são 3.100 perguntas, das quais 71% foram respondidas.

Tem de tudo: de alguém querendo saber se vale a pena comprar um apartamento com varanda “Gourmet” a um fumante buscando ajuda para largar o cigarro. “Não existe pergunta idiota. Se é algo que te aflige, a pergunta é válida”, diz Horácio Poblete, um dos fundadores.

Diferentemente do Yahoo! Respostas ou do Quora, no Ledface a resposta não vem de apenas uma pessoa, mas é construída coletivamente, em um processo de cocriação. As perguntas são enviadas para 50 pessoas que o Ledface acredita serem as mais indicadas. Cada um que entra para responder tem autonomia para corrigir ou aprimorar respostas anteriores.

O Ledface é uma robô mulher. É inspirada na Eva, robô da animação “Wall-E”, da Disney Pixar, que salva a humanidade da destruição.

Cada usuário tem o seu perfil construído a partir de informações subjetivas, como preferência de cores. O perfil evolui de acordo com a interação do usuário.

A tecnologia levou um ano para ser desenvolvida e mimetiza a formação de enxames de abelha.

Com um investimento inicial de R$ 200 mil, bancado pelos sócios e amigos, o site foi um dos três vencedores do Prei (Prêmio RBS de Empreendedorismo e Inovação), anunciado na sexta-feira.

A equipe do Ledface não gosta de comparações com o Quora e tem como referência o Vark, site de perguntas e respostas comprado pelo Google por US$ 50 milhões.

A partir do perfil dos usuários, o Vark buscava pessoas mais adequadas para responder a cada pergunta. Chegou a 100 mil usuários. Apesar do sucesso, foi fechado pelo Google no mês passado.

O Ledface deve entrar em operação para valer em 1º de janeiro. “Agora estamos mais preocupados em aprimorar o site e aumentar o grau de retenção [usuários frequentes]. Hoje a retenção é de 18%, a meta é chegar a 20% até o fim do ano”, diz Poblete.

Ele acredita que será preciso 100 mil usuários para a inteligência coletiva do Ledface se tornar abrangente e relevante. O objetivo é chegar a esse número em seis meses.

 

Inteligência coletiva é produzida por anônimos em site brasileiro

Apesar de se enquadrar na mesma categoria de perguntas e respostas do Quora, o Ledface é quase que a antítese do site do americano.

Enquanto o primeiro faz sucesso por atrair celebridades do Vale do Silício, no Ledface a inteligência coletiva (constituída pelo acervo de perguntas e respostas) é produzida por anônimos.

Sócio fundador do Ledface, Horácio Poblete acredita que, sob anonimato, as pessoas ficam mais dispostas a compartilhar conhecimento de forma espontânea.

“O Facebook e o Quora viraram plataformas para fazer marketing pessoal. Ninguém fala o que pensa de verdade, é uma exposição de egos.”

Em um ambiente anônimo, acredita Poblete, uma pessoa que entende muito de determinado assunto, mas não quer se expor, pode contribuir anonimamente com seu conhecimento.

“No Ledface não interessa quem é você, mas o seu conhecimento. Quando as pessoas têm de se identificar, elas não vão revelar suas dúvidas. E elas só vão dar respostas que possam contribuir positivamente para as suas imagens públicas.”

Para evitar a chamada trollagem -gíria para pessoas mal-intencionadas que se escondem no anonimato da web para fazer comentários abusivos-, o programa faz uma avaliação da performance de cada usuário. Quem contribui de forma construtiva, com respostas que satisfazem ou surpreendem positivamente quem perguntou, ganha créditos.

Por conta da rede de contatos de seus fundadores, ex-Facebook, o Quora atraiu gente de peso em seu início.

Se a pergunta era sobre Palo Alto, a resposta viria de ninguém menos do que o prefeito da cidade americana. Até Mark Zuckerberg, fundador do Facebook, apareceu para responder a perguntas.

Mas o Quora é ainda uma rede fechada. É preciso ser convidado para entrar. “Quando a rede se abrir para qualquer um, a tendência será de queda de qualidade. O enorme conhecimento adquirido pelo Quora até aqui vai acabar se diluindo”, afirma Poblete.

Ele acredita que o anonimato consciente deve atrair mais mulheres para o Ledface. “Elas não entram nessa guerra de egos”, diz ao observar que no maior site de inteligência coletiva, a enciclopédia Wikipédia, 87% dos que contribuem são homens. E eles precisam se identificar e passar pelo crivo de editores.

RECEITA

Para gerar receita, o Ledface pretende atrair publicidade e oferecer versões fechadas para empresas. A ideia é usar a ferramenta para estimular a troca de conhecimento nas empresas, permitindo a interação anônima entre funcionários, passando ao largo de cargos e hierarquias. 

Acabei de me cadastrar no site, e vou fuçar melhor antes de emitir qualquer opinião.

A idéia, porém, já tem meu total apoio!

Invenção da Xerox, a empresa das copiadoras, que acabou sendo copiada…

Ironia do destino: a Xerox, empresa que ficou mundialmente famosa como sinônimo de copiadora (ou máquina de “xerox” mesmo) acabou tendo uma de suas maiores invenções copiadas.
Anos depois, a Xerox enfrenta dificuldades. Enquanto isso, MicroSoft e Apple estão entre as maiores (e mais lucrativas) empresas do mundo – especialmente a Apple.
Eis o vídeo interessantíssimo de uma propaganda de 1972, na qual a Xerox apresentava sua visão sobre o futuro do “computador”:

Interessante, não?!

Em abril de 2012 (alguns dias atrás!), leio esta matéria no Valor Econômico (íntegra AQUI):

A Xerox registrou lucro líquido de US$ 269 milhões no primeiro trimestre deste ano, uma queda de 4% na comparação com o mesmo período de 2011. As vendas da empresa de tecnologia apresentaram queda de 5%, também em bases anuais, para US$ 1,59 bilhão. Por outro lado, o faturamento com serviços e aluguéis, no entanto, subiu 4%, a US$ 3,77 bilhões.

Com isso, a receita líquida da companhia ficou quase estável, em US$ 5,50 bilhões, um avanço anual de 1%. No entanto, esses ganhos foram neutralizados também por um crescimento igual dos custos e despesas gerais, que finalizaram o trimestre em US$ 5,19 bilhões.

O balanço do primeiro trimestre mostrou uma redução da eficiência da Xerox. A margem operacional cedeu 0,6 ponto percentual na comparação com o mesmo período de 2011, até 8,5%.

Para voltar a se expandir, a empresa confirmou que vai continuar investindo no segmento de serviços. “Agora, os serviços representam mais de metade de nossa receita total e vão continuar sendo o motor de crescimento de nossa companhia, enquanto aumentamos nossa oferta de BPO (terceirização de processos de negócios, na sigla em inglês)”, afirmou Ursula Burns, presidente-executiva da Xerox.

No primeiro trimestre deste ano, a receita da companhia com BPO subiu 13%, frente aos mesmos meses de 2011. Enquanto isso, o ITO, que se refere à terceirização em tecnologia da informação manteve-se estável.

E como estão Apple e MicroSoft agora em 2012?!
Apple tornou-se maior do que MicroSoft e Xerox SOMADAS, por exemplo, e tornou-se aquela empresa capaz de influenciar resultados das maiores bolsas de valores do mundo todo:

A forte alta das ações da Apple e os comentários “suaves” (dovish) do presidente do Federal Reserve deram impulso aos mercados de ações e o índice Nasdaq Composite encerrou o pregão com a maior alta do ano.

O índice Dow Jones subiu 0,69% e fechou aos 13.090,723 pontos, enquanto o S&P-500 avançou 1,36% e fechou aos 1.390,69 pontos.

O Nasdaq subiu 2,30% e fechou aos 3.029,63 pontos, impulsionado pela alta de 8,87%, para US$ 610,00, das ações da Apple. Na noite de terça-feira, a gigante do setor de tecnologia anunciou robustos lucros no primeiro trimestre, que foram impulsionados pelas fortes vendas do iPhone e do iPad.

O balanço da Apple ajudou a dissipar os temores de uma potencial desaceleração nas vendas do iPhone e deram impulso as ações do setor de tecnologia nos Estados Unidos e ao redor do mundo.

A alta de hoje foi a maior das ações da Apple desde novembro de 2008 e ajudou a apagar boa parte das perdas acumuladas desde o início do mês. A Apple viu o seu valor de capitalização no mercado disparar quase US$ 50 bilhões hoje, acrescentando no mercado o valor equivalente a uma Hewllet-Packard em apenas uma sessão.

“A máquina da Apple está intacta”, disse Jeff Morris, gerente de carteira e chefe de transações com ações da Standard Life Investments. “De tempos em tempos, o mercado fica preocupado sobre a possibilidade da Apple ficar grande demais para crescer, mas o crescimento da receita, as margens e os lucros parecem ter silenciado” esses temores, acrescentou.

O balanço da Apple deu impulso as ações da Broadcom, uma fornecedora da cadeia de produção do iPhone, que subiram 6,07%. Isso, por sua vez, fez o setor de tecnologia registrar o melhor desempenho no S&P-500, em um dia que todos os 10 setores do índice fecharam em território positivo.
Matéria do Valor Econômico de 25/04/2012, na íntegra AQUI.

Quanto à MicroSoft….

A Microsoft teve uma receita de US$ 17,41 bilhões em seu mais recente trimestre fiscal – o terceiro do ano de 2012, segundo o calendário da companhia. Já o lucro teve uma ligeira retração de 2,3%, ficando em US$ 5,1 bilhões (foram US$ 5,23 bilhões no mesmo período do ano passado).

O resultado satisfez analistas, já que o lucro por ação divulgado pela companhia ficou acima das estimativas compiladas pela Bloomberg: foi de US$ 0,60, contra projeções de US$ 0,57. Às 17h33, as ações da companhia subiam 2,90% nas negociações que acontecem após o fechamento do mercado, o after market.

Das cinco linhas de operação da empresa, apenas a de Entertainment & Devices teve queda nas receitas: 16%, para US$ 1,62 bilhão. De acordo com a companhia, a unidade foi impactada pela desaceleração nas vendas do console Xbox 360. O melhor desempenho ficou com a área de Server and Tools – que vende softwares para os departamentos de tecnologia da informação (TI) das empresas. A receita cresceu 14%, para US$ 1,73 bilhão.

“Com a proximidade do lançamento de novos PCs e tablets equipados com o Windows 8, a chegada da nova versão do Office e uma grande variedade de produtos e serviços para empresas e consumidores residenciais, vamos entregar muita coisa para nossos consumidores ao longo do ano”, escreveu Steve Ballmer, executivo-chefe da Microsoft em comunicado.
Extraído do Valor Econômico de 19/04/2012, na íntegra AQUI.

RESUMINDO: A HISTÓRIA PODE SER MUITO CRUEL COM EMPRESAS QUE TÊM BOAS INVENÇÕES MAS FALHAM AO TRANSFORMÁ-LAS EM INOVAÇÕES.