Hola desde ya agradezco a quien me pueda dar una mano en estas dudas

Explico el escenario, en una organización hay datos repartidos en dos sistemas. Por lo tanto existen dos tablas Clientes por ej, lo mismo con Localidades, Actividades, Lineas (todas las dimensiones). La organización administra y gestiona Créditos otorgados a Clientes (por eso las lineas, que son lineas crediticias). Los indicadores que he definido son dos: desembolsos (pueden haber varios por clientes) y cobros.
En cuanto a estos indicadores los sistemas manejan la información en forma diferente. Por ejemplo el sistema A , tiene Comprobantes, y TiposDeComprobante, para guardar estos datos, en cambio el sistema B, directamente tiene una tabla Pagos asociada al Cliente, y dentro de esta tiene un campo "desembolso", asociado a un tramo para cuando se han hecho mas de un desembolso por cliente.


Mis dudas son las siguientes, habiendo entendido el tema "claves subrogadas", lleno las dimensiones de esa manera, de esa forma puedo solucionar el tema de que algunas claves primarias originales de las tablas "Localidades" (teniendo en cuenta los dos sistemas) se repiten. Y ademas también tengo el caso de que la misma localidad esta en ambas tablas, pero no todas se repiten.


Localidades A Localidades B
id Descripcion id Descripcion
1 xxxx 2 aaaaaa
2 wwwww 3 zzzzzz
... .....


12 zzzzz 33 hhhhhh




El tema es que yo en la tabla dimension_Localidad tengo una clave primaria subrogada... que va a ir a parar como clave foránea en la tabla hechos (y el conjunto de estas claves foráneas de las distintas dimensiones forman la clave primaria de la tabla hechos). Entonces, luego en la tabla hechos si hago una suma de desembolsos por localidades, tengo dos grupos para la localidad zzzzz, mientras que debería tomarse como una. Ademas como hago para consultar los desembolsos que están en tablas de los sistemas operacioneles? No tengo esa información dentro de las dimensiones. Cuando quise hacer un proceso con una consulta que tenga tablas mezcladas del modelo operacion y del modelo del warehouse, no se podia, y aun si se pudiese al tener una clave subrogada pierdo la clave primaria original para matchear con las demás tablas y rescatar los desembolsos.
Y la otra cuestión, creo que al tener descripciones repetidas en la transformación para llenar las dimensiones tengo que limpiar estas repeticiones... luego aunque de alguna manera pudiera rescatar los id's originales faltarían los de las descripciones repetidas.


No entiendo como llevar a cabo esto. En síntesis tengo id's repetidos y descripciones repetidas, pero no todo se repite. Y además la información para calcular los indicadores están en tablas del modelo operacional.