lunes, 27 de octubre de 2008

Interfaz de usuario en SRI

La interfaz de usuario de un sistema informático es el conjunto de mecanismos mediante los cuales intercambia información el usuario y la maquina. Aquel introduce unas órdenes al sistema, como consecuencia de las cuales este realiza las acciones correspondientes.

Lo que brinda esta interfaz es: Eficiencia en el intercambio de información con el usuario para las tareas de control y mantenimiento, minimizan el tiempo de aprendizaje requerido para que el usuario use el sistema, minimizar el cansancio del usuario provocado por el trabajo y fomentan la estandarización dentro del sistema y entre sistemas.

Cuando los sistemas están orientados a usuarios finales como en el caso de los SRI, las características de la interfaz de usuario cobran mayor relevancia.


Shneiderman propone ocho reglas de oro para el diseño de interfaces:


1.Buscar consistencia (en cuanto a terminología, aspecto, estilo, color, etc.)
2.Facilitar atajos o mecanismos rápidos para realizar las operaciones más frecuentes.
3.Proporcionar al usuario información de confirmación.
4.Diseñar diálogos completos y organizar las acciones en grupos.
5.Prevenir errores que pueda cometer el usuario y proporcionar una gestión simple de los mismos
6.Facilitar que se puedan deshacer las operaciones realizadas.
7.Proporcionar posiciones de control interno.
8.Reducir los requisitos de memoria a corto plazo.

Estándares

Hay diferentes tipos de estandares uno de ellos son los Marc, que fueron inicialmente desarrolladas en libros y revistas , pero que se han ido ampliado para cultivar necesidades de otros tipos de documentos.
Estándar CDU (código decimal universal ):
Es un sistema de clasificación temática de los libros que permite asignar a cada tema un código específico. Tambien se llama decimal porque las cifras usadas para catalogar los libros se consideran como decimales, no como números enteros. La CDU parte de un trabajo intelectual de división de las materias de forma jerárquica, lo que hace que las cifras que se usan en el sistema.
ISO 10162 y 10163
Organización Internacional de Normalización (ISO). Se documenta en reparar el servicio de busqueda y definicion, 1992. Se trata estrictamente de una norma de intereoperabilidad para la búsqueda de contenido y se originó en la Library of Congress.
ANSI:
(Instituto Nacional Americano de Estándares). Organización encargada de estandarizar ciertas tecnologías en EEUU. Es miembro de la ISO, que es la organización internacional para la estandarización. Los estándares ANSI buscan que las características y la performance de los productos sean consistentes, que las personas empleen las mismas definiciones y términos, y que los productos sean testeados de la misma forma.

Z39.50:
Norma Nacional Americana para la Recuperación de Información, definición del servicio de aplicación, y especificación del protocolo para las interconexiones de los sistemas abiertos. La ANSI acredita normas de desarrollo que sirven a las bibliotecas, la información, y editores. Aprobó la norma original en 1988.
Bases del protocolo :
El protocolo especifica el formato y los procedimientos que gobiernan el intercambio de mensajes entre un cliente y un servidor, permitiendo al cliente solicitar al servidor que busque en una base de datos e identifique registros los cuales se ajusten a los criterios especificados, y recupere algunos o todos los registros identificados.

Metodos de Sistemas De recuperacion de la informacion

Para la recuperacion de la información hay que tomar en cuenta como predecir que documentos de la colección son relevantes para una determinada búsqueda de información.
En algunos casos las premisas de predicción de relevancia son cuantitativas , permitiendo establecer un orden de presunta relevancia entre documentos seleccionados.

Modelos de búsqueda por texto libre:
No se mantienen índices, por lo que ocupa el mínimo espacio y la formación, una vez introducida, esta directamente accesible. Las interrogaciones al sistema se llevan a cabo por medio del emparejamiento de cadenas de caracteres o por expresiones regulares.

El modelo booleano:
La recuperación se basa en obtener aquellos documentos que cumplan la función lógica expresada en la consulta realizada por el usuario.
Para ello utiliza los operadores propios del álgebra de Boole (AND, OR y NOT) y ficheros de índices invertidos que contienen en sus entradas los documentos que contienen dicho término.

Ejemplo:

-Una palabra: contiene la palabra.
-A and B: contiene las palabras A y B.
-A or B: Contiene A ó B.
-A AND NOT B: Contiene A y no B.



Booleano extendido:
El modelo booleno es simple y elegante, pero al no permitir pesos, no se puede hacer ranking. El tamaño del conjunto respuesta es demasiado grande o demasiado pequeño. Como consecuencia, ya no se usa.
El uso del modelo booleano con pesos y relevancia parcial permite evitar alguno de estos problemas (combinación booleano – vectorial).

Modelo de espacio Vectorial
En el modelo vectorial un documento se enmarca dentro de una colección que tiene unas determinadas características. Así pues, un documento puede considerarse formalmente como un vector que expresa la relación del documento con cada una de sus m características.
La resolución de la consulta consiste en un proceso de establecer el grado de semejanza entre el vector consulta y el vector de cada uno de los documentos.

Modelo basado en el lenguaje natural:
En la actualidad están en desarrollo modelos basados en el procesamiento del lenguaje natural, en los cuales una base de conocimientos intentaría interpretar documentos textuales y generar listas de descriptores de forma automática.El lenguaje natural es demasiado ambiguo para que el contenido de los documentos sea extraído de forma automática.
De la misma forma, para describir el contenido de los documentos Web se han desarrollado diferentes estrategias: metadatos, lenguajes semánticos XML, RDF, OWL para indizar los documentos y representar el conocimiento que contienen, etc.






Evolución del Mercado


El estudio de la evolución del mercado de las bases de datos en los EEUU muestra indicadores de crecimiento muy positivos. Preocupa en especial el efecto que pueda tener sobre la educación y la investigación cualquier hecho que dificulte o pueda dificultar la difusión de la información, como puede ser la ley de protección de las bases de datos.

El problema de consultar una base de datos es debido a que es difícil no dañar el mercado potencial del producto. Cuando se extrae y difunde lo mejor de un libro posiblemente también se daña su mercado potencial. La ley, tal como está redactada puede desanimar a los investigadores a utilizar bases de datos existentes. Aunque para esto hay leyes que dicen que mientras se utilice con fines de ilustración de la enseñanza o de investigación científica. En la medida justificada por el objetivo no comercial e indicando la fuente esta bien.
Por esto se desea que haya autorregulación de la red de redes, no solo por mantener la mayor libertad posible dentro de ella, sino por la gran dificultad de legislar en un entorno multirracial, pluricultural y transnacional como es Internet. Muchas menos referencias hemos encontrado a favor de proteger la propiedad de los autores.
Todos los desarrollos tecnológicos son potencialmente malos y potencialmente buenos. Es importante que se produzca una concienciación social sobre las posibles consecuencias de cada uso concreto de la tecnología, que se fomente la educación para el buen ejercicio profesional a fin de que funcione.

Analisis Documental

El analisis documental es una tecnica en la cual se tiene una selección, asi como un almacenamiento y una organización de ideas informativamente relevantes de un documento para facilitar su localización posterior.
Los resultados de este análisis son el resumen y la indización. El resumen es la condensación del contenido del documento y se realiza en lenguaje natural. La indización consiste en asignar a los documentos unos índices (términos simples o compuestos) que facilitarán su localización.
La necesidad de información del usuario se expresa en el mismo lenguaje documental, de modo que se pueda comparar con la indización de cada uno de los documentos disponibles.
El lenguaje documental en que debe expresarse de la forma más escueta y clara posible, hay dos formas: De las características de la colección y De las necesidades de los usuarios.
Los indices se pueden realizar por clasificacion sitematica basada en la relación arborescente que existe en materias. La lista de palabras vacias son las que no se utilizan como por ejemplo: el , hasta, ella, etc.
El tesauro es una herramienta de lenguaje controlado, más potente que el glosario, a la hora de perfilar la búsqueda. Es un vocabulario completo y dinámico de términos, que refleja las relaciones semánticas y genéricas en términos.
Los términos preferentes del tesauro, se llaman descriptores, nombres o identificadores. Por ejemplo: Nombres de proyectos, Números o símbolos de identificación, Nombres geográficos o geopolíticos etc.
El tesauro es un diccionario que muestra la equivalencia en términos del lenguaje natural y los normalizados. Éstos son los preferidos por el lenguaje documental, y por tanto, los que se asignan en la indización.