PDA

View Full Version : Novato en Pentaho CE 2 en Ubuntu MySQL



hberges
06-18-2009, 04:58 AM
Hola a todos,

La verdad es que hace muy poco que he empezado con Pentaho.
He instalado la version community con mysql en ubuntu (el local) siguiendo los pasos del fantástico manual de Prashant Raju y todo ha ido perfecto.

Lo que pasa es que ahí me quedo. Me he creado un script mysql con toda la información para crear una bbdd que es la que quiero analizar y creo haber realizado todos los pasos para que el Pentaho la descubra, pero no.

En el manual de Prashant, una vez hecha la instalación, carga unos scripts sql, el último de los cuales básicamente crea un BBDD brutal llamada 'sampledata'. A continuación realiza configuraciones sobre una serie de archivos:
pentaho-solutions/system/
▪ applicationContext-acegi-security-jdbc.xml
▪ applicationContext-acegi-security-hibernate.properties
hibernate/
◦ hibernate-settings.xml
◦ mysql5.hibernate.cfg.xml
En los que a mi parecer configura el hibernate para mysql.
También retoca el web.xml i el context.xml
...más de lo mismo.
Pues bien, como experimento he copiado el último script mysql y le he cambiado el nombre (sampledata2) y los privilegios y tal, lo he ejecutado, he creado la bbdd, pero en admin_console no me aparece.

Soy muy novato en ésto, pero a pesar de que mi duda es de principiante total no he encontrado información que me la resuelva.

Creo tener una idea global sobre cómo funcionan estos tipos de software;
Partimos de una bbdd en cualquier formato, se importa y a partir de ahí uno se configura cómo quiere trabajar la información contenida (entiendo que configurando xml's), de modo que te creas tu cubos olap (entiendo que a partir de definir relaciones entre tablas de una bbdd) y a partir de ahí la gran variedad de extracciones de info y visualizaciones posibles...

Me queda un largo camino por recorrer en el Pentaho y estoy atascado de primeras: no puedo seleccionar una bbdd que no sea la de prueba.

Si alguien me pudiera echar un cable o arrojar algo de luz, estaría muy agradecido. También me valen links con la info o cualquier cosa que me guíe un poco en estos momentos de oscuridad :)

Saludos

tdidomenico
06-18-2009, 09:30 AM
Buenas.

Mi recomendación personal, siendo que recién empezás, sería que en lugar de hacer la instalación sobre MySQL, utilices la instalación que ya está preconfigurada para usar la base Hibernate. Quizá esto no sea óptimo en tu ambiente y en el futuro quieras cambiarlo, pero para poder obviar las cuestiones de infraestructura y concentrarte en aprender sobre la plataforma es la mejor opción.

Una vez que entiendas bien el funcionamiento y los componentes migrar la base de datos te va a resultar mucho más sencillo.

Si te interesa intentarlo de esta manera, te recomiendo bajar la versión 3.0 estable de este vínculo: http://sourceforge.net/project/showfiles.php?group_id=140317&package_id=160028

¡Saludos!

hberges
06-19-2009, 10:04 AM
Bien, de momento he continuado con la versión 2.0 que ya había instalado.

Me he bajado he instalado también el design-studio 2.0.0, el report-designer 2.0.0 y el mondrian 2.0.0. Me acabo de bajar el más importante, el workbench, cuya versión más antigua es la 2.3.2.9247.

El tema es que después de instalarlo (el workbench), al ejecutar (./workbench.sh) me da permiso denegado (de hecho no se ve ni como un ejecutable a ojos de mi ubuntu), he probado dos cosas:
1. Cambiar los permisos via linux (KO)
2. Seguir los pasos de este link:
http://sergiovier.com.ar/blog/2008/05/05/problemas-de-instalacion-del-workbench/
KO también... y me pregunto..
Para que todo funcione, deben ser todas las partes de la misma versión y RC? Puedes ser que no funcione porque los tengo todos versión 2.0.0 y éste no?
La verdad es que hoy parecía que empezaba a avanzar y cuando llega lo más bonito (Diseñar cubos) me quedo a las puertas.


Otra cosa que os querría comentar es saber qué necesito a la hora de montarme el sistema a partir de mi BBDD MySQL.

La verdad es que hay toneladas de información en este foro, pero no hay ningún punto que le asesore a uno sobre cómo empezar de 0 CON SU propia BBDD.

En 2 semanas lo que he entendido yo es:

Tenemos el BI Server, que simplemente 'muestra' el datasource que tengas preconfigurado por el Admin Console.

Entiendo que todas las utilidades dadas (report designer, mondrian, schema workbench...) son para gestionar una bbdd original y de la que se extrae información y se almacenan visualizaciones y configuraciones que se acabarán exportando al BIServer de manera que el usuario final con 4 clicks tenga toda la información 'a prueba de tontos'. Me equivoco?

Entonces, partiendo de 0.

1. Tenemos una BBDD de en el formato 'tordosql'
2. Descargamos e instalamos java, i tordosql-server o similar
3. Descargamos el biserver, la última RC stable.
4. Configuramos el biserver para 'tordosql'
5. Nos creamos nuestras BBDD en tordosql
6. Nos descargamos los programas que necesitemos, a saber:
- Report Designer, nos permite configurarnos reports a partir de nuestra propia BBDD y diseñar reports de lo más mono y cuqui que hay. Entiendo que la configuración de los reports se puede exportar para el user final del biserver pueda acceder a estos reports preciosos prefabricados pero con la info actual del momento.
- Design Studio: Creo que es para programar, perfecto para el que sepa Java, yo no tengo ni fláuers.
- Kettle: Creo que va de mover BBDD a cascoporro, juntar BBDD, reunificar formatos, pasar de un formato a otro etc... A priori si lo que tengo yo es una única BBDD, a priori no le veo la utilidad, aunque seguro que la tiene, pero como newbie que soy no la sé ver.
- Mondrian: Uno de los puntos más negros que tengo. Entiendo que proporciona la inteligencia de soporte para hacerte tus cubos olap a partir de tus tablas.
- Schema Workbench (tengo muchas ganas de catarlo): Se dice que es el arma para construir tus cubos con una interfaz clarísima y pedagógica. Supongo que te genera automáticamente unos xml's con las configuraciones deseadas para luego poder tener acceso desde el biserver.

Creo que me dejo cosas que a priori creo que no me hacen falta, como el WEKA, o al menos lo dejaré hasta el día en que no esté taaan perdido.

Agradecería correcciones, consejos o lo que sea para empinar la curva de aprendizaje; llevo casi 3 semanas con ésto y aún me siento como al principio :(

Saludos

tdidomenico
06-22-2009, 10:26 AM
Algunos puntos que creo vale la pena aclarar:

1) La base de datos que la plataforma utiliza (que es la que instalaste en MySQL en lugar de usar Hypersonic como viene por defecto) es completamente independiente de las bases de datos que uses para extraer información. Por eso te recomendaba utilizar la versión preconfigurada: eso no te impide conectarte a los datos que quieras, donde quieras.

2) Design Studio no es para "programar" exactamente: es simplemente un Eclipse (que sí es para programar), pero con una extensión que permite editar Action Sequences (archivos XML con extensión .xaction), que son los archivos que permiten combinar las distintas componentes de la plataforma y ejecutarlas. Por ejemplo, aunque quieras mostrar sólo un reporte, para poder hacerlo en la plataforma vas a necesitar una Action Sequence que lo haga.

3) Mondrian: es un motor de bases de datos dimensionales que se monta sobre una base relacional (ROLAP). Lo ideal es generar una nueva base de datos modelada dimensionalmente (esquema estrella, copo de nieve, etc) a partir de tu base original, y sobre esta nueva base el motor Mondrian te ofrece acceso a partir de consultas dimensionales (MDX, XMLA, etc).

4) Schema Workbench: interfaz gráfica para editar cubos de Mondrian.

5) Weka: aplicación para data mining. (Predicciones, agrupaciones, y un largo etcétera).

¡Saludos!

hberges
06-23-2009, 12:15 PM
La verdad es que estos primeros pasos en el mundo Pentaho los he dado con un lío mental considerable.

Después de investigar el DataIntegration y el SchemaWorkbench ya empeizo a entender ésto muuucho mejor.

Ya he creado mis cubos OLAP a partir del modelo dimensional que me he creado con el Data Integration que ha sacado la info a partir de un excel que me he currado a mano.

A partir de ahora ya tengo material y background para horas y horas...

Està muy interesante y espero poder llegar a saber bastante; tiene muchas posibilidades.

Gracias por tus aclaraciones y consejos