PDA

View Full Version : Integración de Weka y Pentaho



manolot9
07-16-2009, 03:46 AM
Hola buenas a todos,
actualmente estoy realizando mi proyecto fin de carrera,
acabo de instalarme la version 3.0.0 STABLE y me gustaría que me orientarais un poquillo cómo puedo integrar en pentaho alguna interfaz para trabajar con aplicaciones data-mining como son radip-miner y weka, soy nuevo en el tema y nose por donde meterle mano.

Gracias a todos.

tdidomenico
07-16-2009, 09:26 AM
Buenas. Ante todo, cuando comiences una discusión sobre un tema nuevo por favor abrí un nuevo hilo haciendo clic en el botón "New Thread" en la página del foro en el que supongas que tu pregunta es pertinente.

En cuanto a tu pregunta, no estoy seguro a qué te referís con una interfaz para trabajar con las herramientas de data mining. Si te referís a integrar la funcionalidad de Weka (que es parte de Pentaho) en el servidor BI, entonces mirá esta página: http://wiki.pentaho.com/display/DATAMINING/Pentaho+Data+Mining+Community+Documentation, en especial la sección "Plugins for Pentaho Data Integration (Kettle)" y el vínculo "Data Mining Component for BI Platform (http://wiki.pentaho.com/display/DATAMINING/Data+Mining+Component)".

¡Saludos!

manolot9
07-20-2009, 04:27 AM
Gracias por tu respuesta, anteriormente no me he explicado bien, concretamente mi objetivo es realizar una pequeña aplicación dentro de pentaho en la cual quiero realizar filtrados de datos y llamadas a algoritmos de data-maning (como pueden ser los de weka), mi duda es cómo puedo empezar a trabajar en la forma de integrar en pentaho alguna interfaz que resuelva mi objetivo.

Un saludo, y gracias de nuevo.

tdidomenico
07-20-2009, 10:58 AM
Tu pregunta sigue siendo algo general, vamos por partes: ¿ya tenés experiencia en Weka? Porque el primer paso es obviamente armar los modelos.

Por otra parte, ¿qué tipo de aplicación te imaginás para ejecutar los modelos? ¿Te estarías conectando a una base de datos relacional?

Todos los detalles que puedas dar ayudarían para poder orientarte mejor.

¡Saludos!

manolot9
07-20-2009, 12:43 PM
Ante todo gracias de nuevo,
vamos a ver si me puedo explicar con menos abstracción, ya que sólamente tengo ligeros conocimientos en el tema y sé que aún me queda un largo camino,
mi primer objetivo es realizar dentro de pentaho una aplicación propia en la que yo integre ciertos tipos de filtrado de datos también mios propios y en donde pueda realizar llamadas a weka u otra aplicacion de minería de datos, o simplemente utilizar ciertos algoritmos;
para todo esto, lo que yo primeramente tenía pensado es mediante la consulta en los cubos de pentaho exportar a archivos xls los datos de los que dispongamos y a partir de esos archivos realizar estos filtrados y utilizar algoritmos de weka .... siempre dentro de pentaho.
Esta es mi idea general de lo que quiero llevar a la practica, y por ello lo que quiero realizar primeramente es integrar weka dentro de pentaho 3.0 para ver el funcionamiento y así ver mejor como trabaja pentaho y realizar posibles mejoras.

Un saludo.

tdidomenico
07-20-2009, 04:50 PM
Por ahora la integración de Weka con la plataforma está limitada a los complementos que pueden utilizarse con tus datos mediante al herramienta PDI (antes Kettle), que es la aplicación de ETL (extracción, transformación y carga en inglés) de Pentaho. Esta herramienta te va a servir para mover la información desde tu fuente a cualquier destino, evaluándola con algoritmos de Weka como parte del proceso.

Está en desarrollo un componente para integrar procesos de KnowledgeFlow (el módulo de automatización de procesos de Weka) con la plataforma, pero aún no está lista.

Te recomendaría entonces familiarizarte con PDI y con los complementos para los cuales te copié los vínculos en mi primera respuesta.

¡Saludos!

manolot9
07-21-2009, 02:43 AM
Gracias de nuevo,
ya te iré contando como van mis avances.

Un saludo.