Graziela Medeiros

June 30, 2009

Common Information Retrieval Myths

Filed under: Recuperação da Informação — grazielamedeiros @ 13:58

Interessante esse texto sobre  ‘mitos’ da recuperação da informação, tendo em vista que geralmente se faz confusão com o conceito desse termo. No texto foi destacada a importância de áreas como a Biblioteconomia e a Ciência da Informação (mito 2).  Vannevar Bush, importante autor nas referidas áreas também é citado (mito 5).

Os títulos dos ‘mitos’ se refere a tudo o que a recuperação da informação NÃO É. Apesar de estar em Inglês, o texto é objetivo e simples de entender.

1.Information retrieval is the same as Information Extraction

“Information Extraction is not Information Retrieval: Information Extraction differs from traditional techniques in that it does not recover from a collection a subset of documents which are hopefully relevant to a query, based on key-word searching (perhaps augmented by a thesaurus).

Instead, the goal is to extract from the documents (which may be in a variety of languages) salient facts about prespecified types of events, entities or relationships. These facts are then usually entered automatically into a database, which may then be used to analyse the data for trends, to give a natural language summary, or simply to serve for on-line access.” (GATE)

More on that here.

2. Information retrieval is a compter science discipline

No, not quite.
IR is interdisciplinary because of the many different problems which arise within it.
First off our data is usually in text format so we need the area of linguistics and cognitive psychology.

Then the data is stored somehow and is either structured or unstructured so we need information architecture, information science, library science to help with that.

The text and the query are analysed and rendered into a numeric format that a machine can inderstand so statistics come into play also.

We borrow ideas from Physics too and of course many mathematical concepts come into play.

Computer science as a whole is a mozaic of different disciplines.

3. Information retrieval is just for search engines

Search engines are a common example of an information retireval system, but online library catalogs (OPAC), commercial databases like Web of sciences (and many search engines), and even the entire www are all information retrieval systems.

4. Information retrieval’s biggest challenge is ranking documents

“Search is an unsolved problem. We have a good 90 to 95% of the solution, but there is a lot to go in the remaining 10%.” (Marissa Mayer)

She is quite right we had a deluge of work to do in this area still. We have invented the wheel and we have hooked 4 of them onto a box. We don’t have a Ferrari Enzo yet.

Some of the biggest challenges yet involve relevance and feedback, information extraction, multimedia retrieval, effective retrieval, rooting and filtering, interfaces and browsing, “Magic”, indexing and retrieval, distributed IR and integrated solutions.

The “Magic” issue (coined by Bruce Croft) concerns the vocabulary mismatch issues we have.

There is a list of Grand challenges for IR which is published and presented every year. This is the latest document. (PDF)

5. Google pioneered information retrieval

Google did arguably make the most commecially successful information retrieval system, but they were not the first to launch into IR.

In fact no search engine was.

In 1945 Vannevar Bush’s As We May Think appeared in Atlantic Monthly and in this article he described an information retrieval system. In the 1960’s Gerard Salton created the SMART (System for the Mechanical Analysis and Retrieval of Text) Information Retrieval System at Cornell University. One of the 1st papers was Melvin Earl (Bill) Maron and J. L. Kuhns’ “On relevance, probabilistic indexing, and information retrieval” in Journal of the ACM in 1960. In 1963 the Weinberg report “Science, Government and Information” gave a full explanation of the issues concerning the “crisis of scientific information.” – basically we couldn’t manage this huge corpus that we had gathered throughout the centuries.

Karen Spärck Jones researched relentlessly since the 1960’s computational linguistics and their application to IR at Cambridge. J. W. Sammon pioneered the vector model in 1968, and in the 1970’s NLM’s AIM-TWX, MEDLINE are the first ever online IR systems. Round about the same time Theodor Nelson starts introducing hypertext.

Fonte: Escrito por Marie-Claire Jenkins e publicado no site Search Engine People.
Link: http://www.searchenginepeople.com/blog/5-common-information-retrieval-myths.html

June 23, 2009

Interface de busca ‘All for good’

Filed under: Fontes de Informação,Recuperação da Informação — grazielamedeiros @ 12:23

Um grupo de engenheiros, designers e gerenentes de sistemas do Google e outras companhias começaram a trabalhar no All for Good, um novo serviço para ajudar você a encontrar atividades de vontulariado em sua comunidade e compartilhar esses eventos com seus amigos.

All for Good disponibiliza uma interface de busca única para encontrar sites de voluntariados como like United Way, VolunteerMatch, HandsOn Network and Reach Out and Read. Permite busca por categorias pré-determinadas (Education, Health, Nature, Hunger, Website, Seniors, Animals) ou de livre escolha.

O site ainda está em fase de teste.

Fonte: Blog oficial do Google.

Veja também o vídeo:

Caminhos do ensino superior

Filed under: Notícias — grazielamedeiros @ 07:46

Para que o ensino superior brasileiro se desenvolva com alto padrão de excelência, será preciso privilegiar a competência, fortalecer as estruturas decisórias das universidades e aumentar a articulação dessas instituições com o sistema federal de ciência e tecnologia.

Essas foram as principais conclusões dos debatedores reunidos na última sexta-feira (19/6), em São Paulo, no 15º Fórum Nacional-Consecti e Fórum Nacional-Confap.

Os palestrantes abordaram o tema “Ensino Superior e o Sistema Nacional de Ciência e Tecnologia”, na sessão de encerramento do evento promovido pelo Conselho Nacional de Secretários Estaduais para Assuntos de CT&I (Consecti) e pelo Conselho Nacional das Fundações Estaduais de Amparo à Pesquisa (Confap).

De acordo com o presidente da Associação Brasileira dos Reitores das Universidades Estaduais e Municipais (Abruem), João Carlos Gomes, as universidades estaduais e municipais têm papel central no avanço do ensino superior no país – e, por isso, têm necessidade de mais recursos federais. […]

Segundo ele, essas instituições têm um grau de qualificação considerável: de um todal de 44.476 docentes, 39% são doutores, 32% são mestres, 22% são especialistas e 7% apenas graduados. Mas, embora aponte o apoio do Ministério da Educação (MEC) e do Ministério da Ciência e Tecnologia (MCT) em diversos programas importantes – especialmente na área de formação de profissionais –, Gomes destaca a necessidade de uma articulação que traga mais recursos federais. […]

Segundo a secretária de Ensino Superior do MEC, Maria Paula Dallari Bucci, o ministério vem fazendo um longo trabalho de institucionalização das universidades federais, que já estão bem preparadas do ponto de vista científico e acadêmico, mas ainda têm muito o que avançar em relação a articulações externas.

“Há boa relação com o setor público, incluindo o sistema de fomento institucionalizado pelas fundações de amparo à pesquisa. Mas é preciso explorar mais as áreas de extensão e inovação, isto é, a articulação com o meio externo”, afirmou.  “Na universidade, a pesquisa e a extensão têm uma zona de convergência que ainda não foi explorada. A institucionalidade atual é fragmentada e não se conecta com a extensão e a inovação, embora as universidades recebam bom volume de recursos. Temos pela frente o desafio da construção de uma nova institucionalidade: mais leve, mais inteligente e mais racional”, destacou.

Segundo a secretária, um dos principais problemas está relacionado à autonomia: a universidade ainda precisa responder a controles externos exercidos sem o conhecimento de suas práticas e de sua cultura.

O fortalecimento das estruturas decisórias da universidade por meio de órgãos colegiados, que são consolidados na área de pesquisa, ainda é extremamente necessário na área de extensão. A universidade precisa estabelecer seus próprios mecanismos de controle e transparência, demonstrando sua especificidade e sua dinâmica e cultura próprias, indicando claramente que dá conta de estabelecer ligações com o meio externo”, disse. […]

Fonte: Agência FAPESP 22/06/2009

Web 2.0 a serviço da democraia

Filed under: Fontes de Informação,Notícias — grazielamedeiros @ 07:41

Câmara dos Deputados lança portal para ampliar debate sobre projetos de lei com a sociedade

Se você já teve vontade de participar de uma sessão da Câmara dos Deputados, sugerir projetos ou alterar leis, esse desejo agora pode ser concretizado. Foi lançado em junho o e-Democracia, um espaço virtual que vai reunir informações e sugestões para os textos em tramitação na casa. A iniciativa permite ampliar a participação da sociedade na elaboração de leis, mas o acesso ao debate ainda não é totalmente democrático.

O portal e-Democracia, da Câmara dos Deputados, reúne diversas ferramentas de Web 2.0 para ampliar a discussão de projetos de lei com a população. O portal disponibiliza à população, entre outras ferramentas, uma biblioteca digital com estudos e projetos de lei, fóruns de discussão e uma interface colaborativa chamada Wikilégis, em que os internautas poderão elaborar versões das leis e até sugerir emendas aos projetos da Câmara. Especialistas, políticos e agentes do Estado atuarão como mediadores, ajudando a transformar as ideias discutidas no portal em projetos de lei.

Segundo o coordenador do projeto, Cristiano Ferri, integrante do Observatório de Práticas Legislativas Internacionais da Câmara, o portal surgiu da solicitação dos próprios parlamentares, que verificaram a necessidade de ampliar a discussão sobre os projetos desenvolvidos com a sociedade. “O site da Câmara tem fóruns e muitos deputados têm blogs, mas a informação fica difusa. O e-Democracia é uma ferramenta organizada, onde toda essa pluralidade pode ser convertida em algo concreto.”

Ferri ressalta que o portal oferece diversas possibilidades de participação direta da sociedade no processo legislativo. “Estudamos plataformas internacionais já existentes e desenvolvemos um projeto totalmente inovador”, afirma. Além das páginas gerais, o e-Democracia tem duas áreas restritas: o Espaço Cidadão, disponível para qualquer pessoa cadastrada que queira dar sua opinião; e as Comunidades Virtuais, onde apenas especialistas poderão discutir os temas com maior profundidade.

Web 2.0 a serviço da democracia
Para o jornalista e cientista político Juliano Borges, a página é ousada e tem a seu favor o amplo uso das ferramentas da Web 2.0, como os grupos de discussão e o caráter colaborativo, observado em especial na Wikilégis. “Em geral as experiências do governo na internet não costumam ser assim”, compara. “Páginas virtuais institucionais têm alguns espaços de abertura, mas esse portal oferece um envolvimento muito maior.”

O portal, lançado no dia 3 de junho, ainda é experimental. O primeiro tema a ser debatido é a Política Nacional de Mudança do Clima, que tem projetos em tramitação na Câmara. A partir dessa experiência, os organizadores pretendem fazer os devidos ajustes e ampliar as discussões no portal.

Fonte: Revista Ciência Hoje

June 10, 2009

Novo Kit de tradução do Google

Filed under: Notícias,Tecnologias — grazielamedeiros @ 04:58

O Google estreou, nesta terça-feira (09/06), um Kit de tradução que combina a tecnologia de tradução da empresa com ferramentas para a edição de conteúdos.

O produto Google Translate permite que os usuários traduzam textos e o conteúdo de sites para diversos idiomas. O novo kit de ferramentas ajudará também os usuários que desejam editar o texto traduzido, explica o diretor de engenharia da área de desenvolvimento e pesquisas do Google India, Prasad Ram.

A tecnologia de tradução do Google compara as características do texto no idioma original com as do idioma para o qual será traduzido.  A edição dos textos traduzidos com a nova ferramenta ajudará a tecnologia a ser mais precisa.

Graças a uma parceria com a Wikipedia, os usuários podem fazer o download de um artigo para a ferramenta, traduzi-lo em um idioma local com o Google Translate, corrigi-lo e depois publicá-lo na enciclopédia online.

Para os profissionais, o kit inclui ainda um dicionário, um glossário e outros recursos. Os arquivos podem ser privados ou compartilhados.

O kit de ferramentas foi criado na Índia para ajudar os usuários do país a acessarem conteúdos em seu idioma, mas dá suporte a 47 idiomas no total.

http://translate.google.com/toolkit

Fonte: IDG News Service, de Bangalore, de 09/06/2009.
Veja também o vídeo sobre

Google lança ferramenta destinada a usuários do Outlook

Filed under: Notícias,Tecnologias — grazielamedeiros @ 04:23

O Google apresentou um novo software para facilitar que profissionais que usam o Outlook da Microsoft troquem o serviço por seus produtos online de comunicações e colaboração.

O novo produto permite que profissionais continuem usando o Outlook para e-mail e outras tarefas, mas a base da funcionalidade e o armazenamento de dados seriam movidos para o Google, ao invés de serem mantidos nos servidores internos da empresa que usa software da Microsoft.

O produto Google Apps Sync para o Microsoft Outlook está disponível imediatamente no mercado, como parte da já existente versão Premier do Google Apps –que custa 50 dólares por assinante, mas também está acessível gratuitamente para usuários do setor de educação e não-lucrativos.

O gerente do setor de produtos do Google Chris Vander Way afirmou que o novo produto não sinaliza que a empresa está desistindo de seus esforços para convencer empresas a usarem seu e-mail, o Gmail.

“Vemos isso como uma forma de fornecer uma escolha para usuários que prefiram fazer as coisas do jeito antigo do Outlook”, disse Vander Way.

Fonte: Reuters, publicada no Jornal do Brasil

Schwarzenegger apuesta por la enseñanza con Facebook y Twitter

Filed under: Notícias,Tecnologias — grazielamedeiros @ 04:12

El gobernador de California presenta un plan escolar para sustituir los libros de texto por recursos didácticos digitales.- Pretende reducir así el gasto presupuestario

El gobernador de California, Arnold Schwarzenegger, ha presentado un plan de ahorro mediante la apuesta por la enseñanza on line en detrimento de los libros de texto tradicionales, según informa la BBC. Con esta iniciativa, el gobernador pretende reducir el gasto anual en millones de dólares. Además, añade que al privilegiar el estudio digital los alumnos conseguirán una mejor formación.

California afronta un agujero presupuestario de 24.300 millones de dólares y el gobernador Schwarzenegger ha desechado financiar contratos cerrados tras el 1 de marzo. Cada céntimo Schwarzenegger señala que actividades digitales como Facebook, Twitter y descargar contenidos para el iPod muestran que los jóvenes son los primeros en adoptar nuevas tecnologías on line, y por lo tanto Internet es también la mejor manera de aprender en las clases. Desde el comienzo del nuevo año escolar, en agosto, los estudiantes de ciencias y matemáticas en los institutos de California tendrán acceso a textos on line que han aprobado una revisión de estándares académicos. El gobernador sostiene que los libros de texto digitales se pueden adaptar fácilmente, de manera que el aprendizaje se mantiene al ritmo del progreso. La principal razón por la apuesta digital de Schwarzenegger, sin embargo, es el dinero, según añade la BBC. California destinó el año pasado 350 millones de dólares a los libros de texto y ya no puede permitírselo. De manera que la administración estatal está aplicando grandes recortes para afrontar el déficit presupuestario. El lunes, el gobernador firmó una orden ejecutiva para retirar la financiación de los contratos firmados desde el 1 de marzo y para evitar que las agencias estatales acuerden nuevos contratos. “Cada departamento y agencia estatal detallarán cómo han gastado cada céntimo de los contratos, para que así estemos seguros de que el Estado está consiguiendo lo mejor para cada dólar del contribuyente”, ha anunciado Schwarzenegger. El gobernador republicano ha descartado imponer subidas de impuestos para afrontar el déficit. Los votantes rechazaron el mes pasado un paquete de medidas del gobernador para hacer poner coto al agujero presupuestario.

Fonte: El País de 09/06/2009

June 9, 2009

Site professor Bernd Frohmann

Filed under: Fontes de Informação,Organização da Informação — grazielamedeiros @ 07:38

Conheça o site de Bernd Frohmann , Associate Professor da Faculty of Information and Media Studies, The University of Western Ontario, Canadá. O site disponibiliza links para alunos e professores de Mestrado e PhDs em ‘Library and Information Science’, ‘Journalism’,  ‘Media Studies’, além de Informações e links sobre a faculdade, organizações e outros.

Site: http://www.fims.uwo.ca/whoswho/facultypage.htm?PeopleId=65 

Veja a visualização parcial do livro desse autor” Deflating Information: From Science Studies to Documentation” no Google Books: Clique aqui

Sobre o autor: My early research sought to apply Foucaultian discourse analysis to analyze how information, its users, and its uses are constructed as objects of disciplinary knowledge. My current research interests are in documentation, which seeks to rethink the importance of the concepts of the document and documentation for information studies. I am especially interested in the concepts of documentary agency and, following Deleuze, in the affective powers of documents and documentation. Foucault and Latour are also important for this project, the former because of his insistence on documentary and writing regimes, from his studies of the disciplinary society to his later work on care of the self, and the latter not only because of his explicit studies of documentation, but also because of his deployments of the concept of assemblages. Documentation shifts information studies away from the concepts of information and communication to the constructive and constitutive effects of documentary processes and technologies. My book Deflating Information: From Science Studies to Documentation was published in the fall of 2004 by the University of Toronto Press; there, I applied recent work in science studies to raise the question of the role of documentation in fact production.

Livro “Systems of knowledge organization for Digital libraries”

Filed under: Fontes de Informação,Organização da Informação — grazielamedeiros @ 07:31

O que: Livro sobre organização da informação disponível on-line. 

Título: Systems of knowledge organization for Digital libraries: Beyond Traditional Authority Files

Autor: Gail Hodge

Sobre o autor: About the Author

Sumário: Executive Summary

Link: http://www.clir.org/pubs/reports/pub91/contents.html

June 8, 2009

Textos on-line de Saussure, Lévi-Strauss, Jakobson , Barthes e outros

Filed under: Fontes de Informação — grazielamedeiros @ 10:21

Alguns textos (partes de livros e idéias) de autores sobre a Linguística e semiologia disponíveis on-line. Esses autores são muito utilizados em estudos sobre a ‘Representação da informação’ e ‘Organização da informação e do conhecimento’, na área e Ciência da Informação.

Ferdinand de Saussure (1910) http://www.marxists.org/reference/subject/philosophy/works/fr/saussure.htm

Lévi-Strauss – http://www.marxists.org/reference/subject/philosophy/works/fr/levistra.htm

Roman Jakobson (1942) – http://www.marxists.org/reference/subject/philosophy/works/ru/jakobson.htm

Roland Barthes (1964) – http://www.marxists.org/reference/subject/philosophy/works/fr/barthes.htm  

Encontre textos de vários outros autores em: http://www.marxists.org/reference/

A Miniature Library of Philosophy em: http://www.marxists.org/reference/subject/philosophy/index.htm

Next Page »

Create a free website or blog at WordPress.com.