El formato RSS constituye una forma sencilla de monitorizar páginas, bien de noticias, publicaciones, eventos, o cualquier otro tipo, por lo que contituye una forma sencilla de aplicar una vigilancia tecnológica sistema a nivel empresarial sin incurrir en grandes costes.
Con cualquier lector de RSS podemos monitorizar innumerables fuentes, pero ¿qué pasa con aquellas páginas que no proveen de información en formato RSS?
Este es problema que voy a tratar de abordar hoy, como generar información en formato RSS de páginas que no nos dan.
Son bastantes las herramientas que existen en este campo (HTML2RSS) . Hoy recorreré algunas de ellas, me centraré en las más sencillas y citaré otras más complejas pero tambien más potentes.
La primera de ellas es Feedity. Es el más sencillo de todos, se le da la URL y el base a listas de URLs que identifica al análizar la página propone automáticamente su resultado en formato RSS, en caso de que el resultado propuesto no sea correcto, permite realizar un refinamiento indicandole los campos o etiquetas que queremos emplear para delimitar el comienzo y fin de cada item.
Es gratuito y sencillo pero como pegas presenta que los feeds sólo los genera a partir de hipervínculos, es decir, no identificará items que sean texto plano, y tampoco tiene posibilidad de asignar descripción ni fecha, los items solo constan de título y link.
El segundo es Ponyfish. Este se presenta en dos versiones, una gratuita, que permite crear RSS con sólo título y link (como feedity), y otra de pago ($50) que permite definir también la descripción y la fecha. Su interfaz es muy sencilla, no identifica los items de forma automática sino que es el usuario el que va clickando sobre los items para que el sistema aprenda. La versión de pago permite tambien definir filtros sobre los feeds para que solo incluya aquellos items que cumplan una serie de condiciones.
El siguiente en la lista es Dapper (yo diría que mi favorito) . Es también gratuito y presenta una interfaz gráfica verdaderamente asombrosa. Permite no solo generar RSS, sino tambien iCal, JSON, o cualquier otro formato basado en XML. La generación se hace a modo de wizard haciendo click sobre los items que nos interesan. La gran diferencia con los anteriores es que permite generar RSS paramétricos, me explico, si tenemos una página que permite hacer búsquedas y queremos monitorizar más de una búsqueda, generaríamos un dapp para esa página, definiríamos el campo de búsqueda como variable y ya tendríamos generados los RSS para todas las búsquedas que hagamos contra esa página. Además, los dapps generados son compartidos con la comunidad por que probablemente te encuentres con un dapp que ya hace lo que tú quieres (para ver algunos de estos si buscas paramétrico te encontrarás algunos de los que he hecho para buscadores como scirus, espacenet o M2).
A otro nivel tenemos Yahoo!Pipes, Intel Mash Maker, OpenKapow, y otras herramientas para gente con unos ciertos conocimientos de programación que abordaré otro día.
Archivado bajo: HTML2RSS, Mashups | Etiquetado: HTML2RSS, RSS | Deja un Comentario »





