Lucenitos’s Weblog

Just another WordPress.com weblog

Citing styles, bibliographic metadata, bibliographic bookmarking

Good citing is very important in order to give references to one’s sources in a proper way. There are some formulas, therefore, that have to be followed in order to achieve the correct way of citing. Newspapers, magacines, electronic sites or webs…have their different style and it could be interesting to mention which one is better depending on the text that is being written. According to Wikipedia “citation styles can be broadly divided into styles common to the Humanities and the Sciences, though there is considerable overlap. Some style guides, such as the Chicago Manual of Style, are quite flexible and cover both parenthetical and note citation systems. Others, such as MLA and styles, specify formats within the context of a single citation system.” It could be interesting to focus on the MLA citation style due to the fact that this system deals with the arts and the humanities. This style, as Wikipedia mentions “uses parenthetical referencing with author-page (Smith 395) or author-[short] title-page (Smith, Contingencies 42) in the case of more than one work by the same author within parentheses in the text, keyed to an alphabetical list of sources on a “Works Cited” page at the end of the paper, as well as notes (footnotes or endnotes)”.

Roy Tennant in his article “A Bibliographic Metadata Infraestrucutre for the 21st Century” explains that “The current library bibliographic infrastructure was constructed in the early days of computers – before the Web, XML, and a variety of other technological advances that now offer new opportunities. General requirements of a modern metadata infrastructure for libraries are identified, including such qualities as versatility, extensibility, granularity, and openness. A new kind of metadata infrastructure is then proposed that exhibits at least some of those qualities.”

Juan Raúl Cadillo León in his blog Conocimientos y sistemas says that metadata can be used for several purposes. The ISBD (International Standard Bibliographic Description) is used to apply metadata descriptions to bibliographic resources. ISBD was devlopped to give a common use to several rules for bibliogrpaphic descriptions around the world. Therefore, it is used to describe original books, cartographic materials, electronic resources and so on…

ISBD provides clues to know where some specific elements have to be taken into account in order to make a registration of bibliographic metadata.

Sources:

(2010, July 11) From WordPress. Retrieved 19:09. July 12, 2010. From Los Metadatos y la Web Semántica – WordPress.

(2010, July 12) From UK eInformation Group. Retrieved 18:15. July 12, 2010. From Feature article: Bibliographic Management 2.0 – UK eInformation Group.

(2010, July 12) From Roy Tennant – California Digital Library. Retrieved 19:32. July 12, 2010. From A Bibliographic Metadata Infrastructure for the 21st Century.

(2010, July 12) From University of California, Berkely Library. Retrieved 21:03. July 12, 2010. From Citing Your Sources – University of California, Berkely Library.

More links: Luz Ustara – delicious.

julio 13, 2010 Posted by | Uncategorized | Deja un comentario

Folksonomía y taxonomía, marcadores sociales, etiquetas vs categorías y metadata

La folksonomía, como define Wikipedia, es “una clasificación colaborativa por medio de etiquetas simples en un espacio de nombres llano, sin jerarquías ni relaciones de parentesco predeterminadas. Se trata de una práctica que se produce en entornos de software social cuyos mejores exponentes son los sitios compartidos como del.icio.us”. Permite a los usuarios compartir etiquetas con mayor albedrío. En un artículo del país se nos explica por ejemplo cómo emerge esta nueva forma de poner orden entre la gran cantidad de información existente en la red. El país pone el ejemplo de una universitaria de 22 años llamada Beu Ribe. Beu Ribe mantiene miles de fotos ordenadas con etiquetas que ella misma se encarga de denominar. A partir de estas, los internautas pueden acceder a otras muchas fotografías pertenecientes a otros usuarios pero que guardan un denominador común. Como explica el artículo, los servicios tradicionales de clasificación son inflexibles y no permiten tanta volatilidad, ya que se tratan de sistemas prefijados y jerarquicos (dentro de ellos se encontraría la taxonomía). Sin embargo, la folcsonomís, como la misma palabra indica (folc en alemán es pueblo) contiene un elemento de interactuación muy útil para la búsqueda de información rápida y flexible. De todas formas, no hay que olvidar que se trata quizá de una manera un tanto caótica de organizar la información y que no siemrpe dará el resultado deseado debido a su falta de precisión.

Las taxonomías son útiles cuando se requiere un alto número de criterios de clasificación. Las categorías funcionan con criterios de ordenación taxonómicos. Parafraseando a Irene Fernández en el artículo Etiquetas y tags vs. categorí­as en los blogs, una categoría normalemente implica un ordenamiento creado por un administrador a diferencia de las etiquetas creadas por el autor o usuario. Las etiquetas son términos no jerárquicos asociados a una porción de información determinada y funcionan como metadatos que contribuyen a la descripción de la información en sí permitiendo que dicha información sea recuperada en búsquedas anteriores. La categoría se describe como un elemento estrucutrado mientras que la etiqueta puede usarse sin jerarquía alguna. La ventaja que se obtiene del uso de las categorías, por consiguiente, es que estan permiten estrucutrar la información y dar lugar a una búsqueda cómoda, rápida y sencilla. Las etiquetas, en cambio, las crea el propio usuario creando ciertas asociaciones que mejor permitan representar el contenido. como observa  David Bonilla en su artículo Tagging: Categorías vs. Etiquetas, la dificultad del uso de etiquetas o “tags” deriva de los homónimos (mismas etiquetas para distinto significado) y sinónimos (múltiples etiquetas con el mismo significado) que se crean en la red y que dificultan en gran medida la búsqueda de cierta información. ¿Son útiles las etiquetas? Dentro de marcadores sociales o “social bookmarking” como “delicious” las etiquetas permiten un rápido almacenamiento de información dentro de una página web que, además, pueden ser compartidas por varios usuarios, de ahí que se denominen marcadores sociales. Delicious ha permitido almacenar y organizar una ingente cantidad de información mediante el uso de “tags” o etiquetas compartidas por millones de internautas. Es de gran utilidad y deja osboletos a los anteriores sistemas organizativos.

Más fuentes:

(2010, June 29) From Emenia – Creación y diseño Web. Retrieved 21:42. June 29, 2010. From Taxonomías en WordPress – Emenia.

(2010, July 1) From WordPress. Retrieved 18:11. July 1, 2010. From Categories versus tags – What’s the difference and which one? – Lorelle – WordPress.

(2010, July 3) From WordPress. Retrieved 22:01. July 3, 2010. From Custom Taxonomies – WordPress.

Más enlaces: Luz Ustara – delicious.

julio 5, 2010 Posted by | Uncategorized | Deja un comentario

Twitter: aspectos semánticos del microblogging, fragmentación del discurso y conversaciones sociales

Twitter es una herramienta relativamente nueva también conocida como “microblogging”. El prefijo “micro” da a entender que hay un espacio reducido de caracteres para cada mensaje. Lo importante en Twitter es la inmediatez y la concisión del “twit”. La esconomía lungüística cobra, entonces, una importancia enorme en los discursos. Lo esencial es la interacción breve y rápida que se crea entre el emisor del mesaje y sus múltiples receptores. Ya sea un usuario anónimo, ya sea una entidad pública o un personaje famoso, Twitter pone de manifiesto la necesidad del hombre de comunicar…con Twitter la banalidad del día a día también se convierte en relevante.

El discurso fragmentado en twitter contiene rasgos del lenguaje periodísitco, son mensajes a modo de titular de periódico que pueden tener o no relevancia pública. la reducción de caracteres obliga al usuario a economizar su mensaje y a optimizar la imformación que se ofrece. Es una herramienta fácil por su brevedad y concisión. en contraste con el formato del blog, cuya extensión es menos limitada, twitter consigue crear un universo repleto de mesajes breves en el que la rapidez de interacción es un factor de máxima relevancia.

Estos discursos fragmentados o los famosos “twits”, a pesar de no contener gran cantidad de información o quizás gracias a ese aspecto precisamente, funcionan como efectivos mesajes divulgativos. Su abrumadora rapidez no hace más que recordarnos el rápido paso del tiempo, el “tempus fugit” del que hablaban los clásicos. Finalmente se trata de una herramienta que pone de manifiesto el “carpe diem” tan alabado. Se hace inevitable rememorar la famosa frase de Andy Warhol : “en el futuro todo el mundo será famoso durante quince minutos. Todo el mundo debería tener derecho a 15 minutos de gloria”. Twitter consigue mucho más…miles de minutos de gloria para millones de personas.

Fuentes:

(2010, June 27) From Wikipedia, the free Encyclopedia. Retrieved 14:53.  June 27, 2010. From Twitter – Wikipedia, the free Encyclopedia.

(2010, June 27) From Wikipedia, the free Encyclopedia. Retrieved 15:25. June 27, 2010. From Microblogging – Wikipedia, the free Encyclopedia.

(2010, June 28) From Twitter. Retrieved 16:24. June 28, 2010. From Twitter.

(2010, June 28) From Guardian.co.uk. Retrieved 17:00. June 28, 2010. From How to Make the Most of Twitter.

(2010, June 28) From Educ.ar. Retrieved 17:32. June 28, 2010. From Twitter y el boom del microblogging.

Más enlaces: Luz Ustara – delicious.

junio 29, 2010 Posted by | Uncategorized | Deja un comentario

¿Qué es Twitter?

Hoy me he abierto una cuenta en Twitter y no me acaba de quedar muy clara su función. De todas formas, si tantos usuarios alaban su condición, no dejaré de intentar descubrir sus ventajas.

 Enlance: www.twitter.com/lucenitos

En poco tiempo daré cuenta de mis descubrimientos, hasta entonces…twittead conmigo.

noviembre 10, 2009 Posted by | Uncategorized | Deja un comentario

Biblioteconomía

La biblioteconomía, conocida también en algunos países hispanoamericanos como bibliotecología, es el conjunto de actividades técnicas y científicas que tiene como finalidad el conocimiento de la información, de los materiales en que se presenta y del lugar en que se hace uso de ella, para con esto responder mejor en calidad y cantidad a las demandas de información que hace la sociedad. El término deriva de las palabras griegas Biblion (‘libro’), theke (‘caja’) y nomos (‘ley’).

La biblioteconomía y Ciencia de la Información es la técnica cuyo campo lo constituyen las colecciones de libros y las publicaciones periódicas (revistas y periódicos), la información y la gestión del conocimiento. Este último rol a lo largo del tiempo se ha ido ampliando al manejo de las tecnologías de la información. La biblioteconomía también se interesa por otros formatos o recursos de información, como por ejemplo, publicaciones periódicas en línea, los discos compactos (CD-ROM) y DVD, las microfichas, las filmaciones (vídeo-cassetes, microfilm), las cintas de audio, etc.

La biblioteconomía se puede dividir en teórica y aplicada. En la primera incluimos temas como la teoría de la información y la gestión del conocimiento, el estudio de la necesidad de información y cómo satisfacerla al mundo, los factores externos que influyen en la interpretación de los conocimientos, etc. La biblioteconomía aplicada se ocupa de temas tales como el desarrollo y mantenimiento de las colecciones, servicios técnicos (adquisición, catalogación, préstamo y descarte o depuración) de las colecciones, cooperación interbibliotecaria, derechos de autor, libertad de información (derecho al acceso a la información), conservación, gerenciamiento de la biblioteca o unidad de información, etcétera. Junto con la bibliometría está la informetría o medida de la capacidad potencial de transferencia de información documental de un sistema documental o bibliotecario. Mide la cantidad de información posible con un algoritmo de búsqueda basado en las palabras clave o codigos descriptores que el lector usa en lenguaje natural y los equivalentes y sinónimos que el sistema o base de datos ha utilizado para catalogar los documentos (términos contenidos en las categorías en el caso de la Wikipedia). Si sumamos las interacciones u ocurrencias y establecemos un índice de calidad de la búsqueda por el logaritmo natural, que sería 1, 2 y 3 el óptimo para la recuperación de información conseguida. Es semejante al número de referencias que descarga un motor de búsqueda en Internet.

Existen diversos sistemas de clasificación que se utilizan, con el objetivo primario de organizar físicamente las colecciones de las bibliotecas en los estantes, siendo los más empleados el de Dewey o clasificación decimal universal, CDU en Europa, el sistema de la Biblioteca del Congreso de los Estados Unidos, BLISS, clasificación facetada de Ranganathan, etc. Mediante el empleo de estas clasificaciones, es posible asignar al material en forma individual y al organizarse en los estantes (ejemplo, un libro) un código numérico o alfanumérico que refleja su contenido (temas o materias), y que sirve para ubicar juntos en los estantes los materiales que tienen contenidos relacionados.

La organización de una biblioteca, esto es, la organización física por materias de un catálogo de libros, ha llevado al estudio del cómo estructurar el conocimiento humano: Catalogación y Clasificación. El estudio de la arquitectura de la información incluye una especialidad denominada Bibliometría, que se ocupa por ejemplo de los índices de citas o citation index, el factor de impacto o impact factor, el número de veces que un artículo es citado en otros artículos, etc. El enfoque hacia el mundo empresarial se expresa en la Gestión del conocimiento, que busca calidad o relevancia y difusión selectiva del conocimiento, para hacer frente a la sobrecarga de información. El mundo de las bibliotecas y centros de documentación es muy sensible hacia el conocimiento de sus usuarios y autores, lo que supone estudiar las necesidades de los clientes mediante encuestas y entrevistas (métodos obstructivos) o mediante el análisis de los patrones de búsqueda de los clientes, como puede ser el análisis de los weblogs de los catálogos (métodos no obstructivos).

Fuente:http://es.wikipedia.org/wiki/Biblioteconom%C3%ADa

septiembre 4, 2009 Posted by | aelejabe, rdf0809, Uncategorized | Deja un comentario

Documentación

Sería interesante conocer lo que Wikipedia define como “documentación” y las múltiples disciplinas que esta engloba. Se nombra esta palabra constantemente pero quizá haya gente que todavía desconozca lo que significa stricto sensu.

En sentido restringido, la documentación como ciencia documental se podría definir (a grandes rasgos) como la ciencia del procesamiento de la información. Integradora y globalizadora, se trata de una ciencia enriquecedora y generalista, de ámbito multidisciplinar o interdisciplinar. La ciencias de la documentación engloban, según la mayoría de los autores: la biblioteconomía, la archivística, la documentación y la museología.

Tiene que ver con la gestión del conocimiento, que es como utilizar cualquier clase de información y hacerla productiva o que dé el máximo beneficio, como si se tratara de otro bien económico. Asimismo, tiene que ver con arquitectura de la información o como se construyen los modelos para los soportes: Internet o encuestas, datos numéricos, fotografías, mapas, diarios, artículos de revistas, etc., es decir, un número ilimitado de soportes. También tiene el modelo la connotación de un método científico, mediante un algoritmo, que valida los resultados de búsqueda mediante la utilización de base de datos relacionales (tablas de datos).

 Biblioteconomía es la recuperación y presentación clasificada, ordenada y valorada de documentos impresos y de vídeo y audio sobre un tema preciso, que puede ser un artículo o un sistema o un producto o un descriptor. En una obra científica es la bibliografía de un informe final, tanto la que ha sido utilizada como la sugerida de ampliación. En cinematografía, es la recopilación de fuentes escritas o audiovisuales sobre una película (documentación de un tema).

En la obra científica o de no ficción formará parte de los créditos de la calidad del trabajo o bibliografía utilizada, y es parte del trabajo desarrollado, donde deberán figurar listas de fuentes; también son técnicas de documentación los glosarios, los índices temáticos y de autores citados, tablas auxiliares, etc.

Como funciones de un bibliotecario-documentalista profesional, como autor o como colaborador, el especialista en documentación conoce todas las variantes descritas y utiliza programas de cómputo específicamente desarrollados por programadores y que él mismo puede adaptar a cada tarea, como por ejemplo construir de forma instantánea un índice da materias por el método de palabras utilizadas y sus frecuencias o hacer un análisis de contenido o construir algún tipo de indicador de medida de la información o investigar sobre algoritmos de búsqueda o sobre motores de búsqueda en el ámbito de la informática.

El modelo de un sistema de información será con un modelo sistémico aplicado a un sistema complejo. Incluirá la captación de fuentes y su adecuación al problema a documentar; esto será la primordial tarea. El propósito es hacer máxima la cantidad de información captada y mínima la básica utilizable.

En el proceso de un trabajo sobre cualquier tema se comienza con documentarse sobre lo que se va a trabajar, y la forma más simple es consultar enciclopedias temáticas o bases de datos en Internet, como Wikipedia.org, monografías.com, geocities.com, Dialnet, Diccionario Crítico de Ciencias Sociales, enciclopedia.com etc. De una forma progresiva se encuentran fuentes nuevas y mucha información precisa.

Fuente: http://es.wikipedia.org/wiki/Documentacion

agosto 31, 2009 Posted by | aelejabe, rdf0809, Uncategorized | Deja un comentario

Traducción automática

La traducción automática (TA), también llamada MT (del inglés Machine Translation), es un área de la lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. En un nivel básico, la traducción por computadora realiza una sustitución simple de las palabras atómicas de un lenguaje natural por las de otro. Por medio del uso de corpora lingüísticos se pueden intentar traducciones más complejas, lo que permite un manejo más apropiado de las diferencias en la tipología linguística, el reconocimiento de frases, la traducción de expresiones idiomáticas y el aislamiento de anomalías.

En las últimas décadas ha habido un fuerte impulso en el uso de técnicas estadísticas para el desarrollo de sistemas de traducción automática. Para la aplicación de estas técnicas a un par de lenguas dado, se requiere la diponibilidad de un corpus paralelo para dicho par. Mediante este corpus se estiman parámetros de sendos modelos estadísticos que establecen la probabilidad con la que ciertas palabras son susceptibles de traducirse por otras, así como las posiciones más probables que tienden a ocupar las palabras de la lengua destino en función de las palabras correspondientes de la frase origen. El atractivo de estas técnicas radica en que el desarrollo de un sistema para un par de lenguas dado puede hacerse de manera muy automática, con una muy reducida necesidad de trabajo experto por parte de especialistas en lingüística.

La intervención humana puede mejorar la calidad de la salida: por ejemplo, algunos sistemas pueden traducir con mayor exactitud si el [usuario] ha identificado previamente las palabras que corresponden a nombres propios. Con la ayuda de estas técnicas, la traducción por computadora ha mostrado ser un auxiliar útil para los [traductores] humanos. Sin embargo, y aún cuando en algunos casos pueden producir resultados utilizables «tal cual», los sistemas actuales son incapaces de producir resultados de la misma calidad que un traductor humano, particularmente cuando el texto a traducir usa [lenguaje coloquial] o familiar.

En esta dirección, recientemente están cobrando especial interés las técnicas estadísticas de traducción asistida basadas en una aproximación interactiva-predictiva, en la que el computador y el traductor humano trabajan en estrecha colaboración mutua. Tomando como base el texto fuente a traducir, el sistema ofrece sugerencias sobre posibles traducciones a la lengua destino. Si alguna de estas sugerencias es aceptable, el usuario la selecciona y, en caso contrario, corrige lo necesario hasta obtener un fragmento correcto. A partir de este fragmento, el sistema produce mejores predicciones. El proceso continúa de esta manera hasta obtener una traducción completamente aceptable por el usuario. Según las evaluaciones realizadas con usuarios reales en el proyecto TransType-2, este proceso permite reducir considerablemte el tiempo y esfuerzo necesarios para obtener traducciones de calidad.

Fuente:http://es.wikipedia.org/wiki/Traducci%C3%B3n_autom%C3%A1tica

junio 18, 2009 Posted by | rdf0809, Uncategorized | Deja un comentario

Recursos lingüísticos digitales

Hoy en día existen una gran variedad de recursos lingüísticos digitales que ayudan al usuario a realizar todo tipo de tareas: desde buscar el significado de una palabra en cualquier idioma a traducir un texto de una lengua a otra en unos segundos. Se podría decir que casi todo es posible, sin embargo, hay que evitar el peligro de dejarse llevar por estas facilidades y no perder de vista el trabajo intelectual. Es evidente que la traducción simultánea de un texto dará muchas pistas al usuario acerca de lo que se describe en el texto pero nunca realizará (por lo menos hoy por hoy) una traducción exacta. Para llevar a cabo una tarea adecuada habrá que trabajar sobre el texto traducido intentando acercarse lo máximo posible a su significado esencial.

Los recursos son herramientas, los recursos son medios, no hay que olvidar que el fin último nunca deja de lado el trabajo intelectual, el trabajo primitivo entre el sujeto y el objeto.

junio 18, 2009 Posted by | rdf0809, Uncategorized | Deja un comentario

American National Corpus

It is natural to think that if there exist a British National corpus, there will be an American one. The importance of American English has reached the level of consideration of the Brtish English. Nowadays it could be argued that there are two standard English: the British English and the American one.

The American National Corpus (ANC) project is creating a massive electronic collection of American English, including texts of all genres and transcripts of spoken data produced from 1990 onward. The ANC will provide the most comprehensive picture of American English ever created, and will serve as a resource for education, linguistic and lexicographic research, and technology development.

When completed, the ANC will contain a core corpus of at least 100 million words, comparable across genres to the British National Corpus (BNC). The corpus will also include an “opportunistic” component of potentially several hundreds of millions of words, chosen to provide both the broadest and largest selection of texts (and, where available, annotations) possible.

source:http://americannationalcorpus.org/

junio 18, 2009 Posted by | rdf0809, Uncategorized | Deja un comentario

What is the British National Corpus?

The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of British English from the later part of the 20th century, both spoken and written. The latest edition is the BNC XML Edition, released in 2007.

The written part of the BNC (90%) includes, for example, extracts from regional and national newspapers, specialist periodicals and journals for all ages and interests, academic books and popular fiction, published and unpublished letters and memoranda, school and university essays, among many other kinds of text. The spoken part (10%) consists of orthographic transcriptions of unscripted informal conversations (recorded by volunteers selected from different age, region and social classes in a demographically balanced way) and spoken language collected in different contexts, ranging from formal business or government meetings to radio shows and phone-ins.

The corpus is encoded according to the Guidelines of the Text Encoding Initiative (TEI) to represent both the output from CLAWS (automatic part-of-speech tagger) and a variety of other structural properties of texts (e.g. headings, paragraphs, lists etc.). Full classification, contextual and bibliographic information is also included with each text in the form of a TEI-conformant header.

To sum up it could be said that this BBC is very helpul in order to understand the meaning of a word by having a great number of different contexts to compare its meaning.

Source:http://www.natcorp.ox.ac.uk/corpus/index.xml

junio 17, 2009 Posted by | rdf0809, Uncategorized | Deja un comentario