Tag: big data

Confluent cierra acuerdo de partnership con PUE 1456852799_Flag_of_United_Kingdom

Confluent, la compañía detrás de la distribución empresarial de Apache Kafka®, establece un acuerdo de colaboración con PUE gracias al cual se nos reconoce como partner oficial no solo en la parte de consultoría como integrador de servicios (Confluent Preferred Consulting & SI Partner), sino también como partner de formación oficial (Confluent Training Partner) exclusivo para España y Portugal.

Leer más

LDA y LDA2vec : Comparativa de performance para el Modelado de topics

Entre otras razones, el Big Data aparece por la necesidad de gestionar, manipular y analizar la cantidad ingente de datos que se genera hoy en día en nuestra sociedad híper conectada. La mayor parte de las veces, la información está en formato no estructurado, como es el caso de los textos. De ahí que la Minería de Textos tome gran relevancia a la hora de poder analizar textos y más concretamente el Modelado de topics, que nos permite estudiar la temática de los mismos. Este artículo … Leer más

Las oportunidades de Big Data en Cloud con Apache Kafka

Las tecnologías de Big Data y Cloud han evolucionado en paralelo, sin embargo, ¿pueden convivir estas tecnologías?, ¿es posible aprovechar las ventajas del Cloud para las plataformas de Big Data?  Son preguntas que a menudo nos formulamos y que sorprende la facilidad que la respuesta supone.  En éste artículo, abordaré algunos de los retos y sobre todo las oportunidades que hay para enriquecer las plataformas de Big Data en Cloud.  Me centraré en Apache Kafka gobernado … Leer más

Grafana y Solr para la monitorización de aplicaciones Big Data

Tener una visualización de las aplicaciones que están corriendo en un clúster de Big Data, es de vital importancia para conocer el estado y la evolución de las mismas. Para ello, existen diferentes formas de monitorizar: en el caso de Cloudera se puede visualizar con Cloudera Manager o existe también la opción Webui de Yarn. 

El problema de estas opciones es que la información no se almacena de manera infinita, siendo imposible visualizar grandes históricos.  También, … Leer más

GIT como facilitador de trabajo en equipo

 
Contexto de GIT en el mundo colaborativo

El creador de LINUX creó GIT como una herramienta que le permitiera coordinar el trabajo en equipo entre sus miles de colaboradores.  La idea era tener un trabajo original y crear copias que se irán editando para completar el trabajo original, permitiendo la comunicación entre los diferentes colaboradores del proyecto o trabajo a realizar.

Lo bueno de ésta herramienta, es que puede ser complementada con otras como JIRA, controlando las … Leer más