Aplicación de Bigdata,  Búsqueda de información en Twitter.

En entradas anteriores hemos hablado sobre Twitter y sus funcionalidades y sobre la definición de Bigdata y sus aplicaciones.   En esta entrada describiremos la herramienta de  búsqueda de tweets de http://libreinformacion.com/search.php , la cual ha sido implementada con el objetivo de extraer las publicaciones con más interacción y con mayor valor por parte de los usuarios sobre determinados temas.    ¿Porque una herramienta de búsqueda sobre twitter?   Según cifras oficiales de Twitter,  cada día se publican 500 millones de tweets teniendo más de un 77% de cuentas por fuera de los Estados Unidos.   Twitter por tanto es un claro ejemplo de Bigdata,  teniendo muchísima velocidad de publicación, una gran  variedad de fuentes de información y un gran volumen.    

De otra parte twitter ha sido base para numerosos estudios en campos como la publicidad o los mercados financieros,  ya que permite concluir que la actividad de los usuarios en dicha red social establece una correlación directa con el comportamiento de las características de las empresas.   Nielsen recientemente ha publicado un estudio en el cual afirman que twitter sirve como un medidor del engagement que producen los eventos televisados en vivo.    En pocas palabras concluyen que un aumento en las conversaciones del público en twitter durante la señal en vivo de programación permite establecer un alto nivel de «engagement» con la programación que se está emitiendo.    Se convierte en un termómetro del nivel de involucramiento del público con el evento.

Fuente : http://www.nielsen.com/us/en/insights/news/2015/social-tv-a-bellwether-for-tv-audience-engagement.html

Volumen.

De aproximadamente 500 millones de tweets que se producen en un día,  la herramienta de búsqueda está analizando solo los tweets que incluyen las palabras “Bigdata, Elearning, analytics, s&p500, MarketingDigital, SEO, Mooc, adwords,  CommunityManager, Hacking”.  En cuanto a la localización de los usuarios que envían los tweets no se han puesto restricciones geográficas.  

La herramienta permite buscar mediante palabras claves y permite filtrar las búsquedas por el número de retweets o favoritos que haya tenido el tweet.   A partir de la base de tweets que han sido seleccionados y extractados muestra todos los tweets encontrados con la información que se muestra en la imagen.

Velocidad: Ventanas de 15  minutos.

Por restricciones del API de Twitter se pueden realizar consultas en ventanas de cada 15 minutos hasta un máximo de 450 peticiones. La herramienta está procesando la información recopilada cada hora para evitar llegar al límite que permite Twitter.