14 de febrero de 2014

Búsqueda y Clasificación de Trabajos Relacionados

Investigación
Semana 4

La cuarta reunión con mi asesora de tesis la lleve a cabo en línea el 7 de Febrero del 2014 donde se dio revisión a mi avance de tesis de acuerdo a lo contemplado para la semana, se sugirieron algunas modificaciones para los archivos de LaTeX, hubo algunos consejos generales en cuanto a la extensión que deben de llevar los textos a lo largo de todo el trabajo de tesis, y por último se explicó de forma general la tarea con que habría de cumplir para esta semana.

Tareas realizadas

De forma general las tareas realizadas fueron las que se listan a continuación:
  • Corrección de errores en el documento de tesis.
  • Búsqueda de trabajos relacionados con mi tesis.
  • Explicación de cada trabajo relacionado encontrado con su respectiva cita.
  • Avance de código para el modulo de servicio web.

Búsqueda de trabajos relacionados

En la sección de trabajos relacionados dentro de mi tesis agregue los trabajos encontrados divididos en algunas subsecciones de acuerdo a la temática de cada uno. Para la búsqueda de trabajos relacionados utilice algunos buscadores/servicios como Google Scholar, ACM Digital Library, ScienceDirect, IEEE Xplore y Springer Link donde encontré gran cantidad de información de artículos y algunos libros, de los cuales algunos es posible la descarga de forma gratuita, pero esto depende de la red a donde estés conectado, por ejemplo dentro la red de la universidad es posible acceder de forma gratuita a muchos de los mismos, cumpliendo la condición de que los mismos sean para uso personal y con fines de investigación.

Para lograr encontrar los trabajos relacionados fue necesario hacer búsquedas con palabras claves, las cuales pudieran arrojar un buen listado de artículos y/o libros similares a la temática de mi tesis. Entre las palabras/frases que usé para esta búsqueda se encuentran las siguientes:
  • ocr
  • text recognition
  • image processing for text recognition
  • analysis of text information
  • information analysis
  • text analysis
Encontré un total de 15 trabajos relacionados, veamos algunos de estos:
  • Data Management And Analysis Methods
    Gery W. Ryan and H. Russell Bernard
  • A method for text localization and recognition in real-world images
    Lukas Neumann and Jiri Matas
  • Untangling Text Data Mining
    Marti A. Hearst
  • Speech and Text-Image Processing in Documents
    Marcia A. Bush
  • Robust Pre-processing Techniques for OCR Applications on Mobile Devices
    Loh Zhi Chang
  • Language-support System Using Character Recognition
    Kikuo Asai
  • Effective Text Extraction and Recognition for WWW Images
    Jun Sun
  • Information Retrieval and OCR: From Converting Content to Grasping Meaning
    Jamie Callan
Para cada uno de los anteriores y de los faltantes en esta lista, se escribió una pequeña explicación de que temática abordan y por qué estos están relacionados a mi trabajo.

Creación de una API para obtención de datos

Usando el framework Ruby on Rails cree una API sencilla que se encarga de recuperar datos almacenados en una base de datos, y los devuelve en formato JSON.

En pocas palabras para esta API se hace llamar a una URL, tal y como se puede hacer con AJAX de Javascript desde el navegador, y esta regresa como contenido información estructurada en su formato JSON, el cual después puede ser utilizado para un posterior procesamiento o simplemente mostrar esta información por algún medio.

La siguiente imagen muestra como se ve el resultado para la consulta de un producto con el ID 2.


Cuando se intenta consultar una URL de un producto el cual no existe en la base de datos se muestra un mensaje de error.


También se puede acceder a toda la lista de productos de una sola vez.


Los datos fueron agregados para la prueba por medio de formularios básicos. Se muestra la vista web donde esta el listado de los productos y las opciones de eliminar, editar y visualizar.


Avances para la siguiente semana

  • Resumen de trabajos relacionados relevantes.
  • Corrección de errores y avance de más textos dentro de la tesis.
  • Mejorar la detección de texto en imágenes siguiendo las sugerencias proporcionadas por la comunidad de OCR.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.