Data Integratie Tools voor
Enterprise Information Integration Leverancierselectie; Tactische Keuzes Augustus 2013
Data Integratie
In deze Brochure. Gegevensintegratie wordt steeds belangrijker naarmate het datavolume en de noodzaak om de bestaande gegevens te delen explodeert (zie Sensing as a Service; http://issuu.com/jamboflip/docs/sensingaasdef ).
De druk voor het vergaren van real time gegevens om zo snel te kunnen reageren op zakelijke (analytische) behoeften en business agility wordt steeds groter. Data integratie omvat zowel architectuur technieken en tools voor het bereiken van consistente toegang tot en verstrekking van gegevens voor alle betrokken gebieden en datastructuurtypes in een onderneming maar ook de integratie van alle (On Premises) applicaties en bedrijfsprocessen. Data integratie raakt het hart van de toegevoegde waarde die informatie voor een onderneming biedt door het moeiteloos delen van gegevens over alle organisatorische en systeemgrenzen heen.
Data integratie omvat o.a. data kwaliteit, MDM, applicatie integratie, In-Memory en vooraf geconfigureerde of speciaal gebouwde hard- en software en platformen voor data management. Met de introductie van internet webapplicaties en Cloud Computing verschuift de focus bij Enterprise Information Integration van data integratie naar applicatie integratie via API’s (Application Programming Interface). Cloud Computing stelt naast een Service Oriented Infrastructure (SOI) een aantal unieke en nieuwe eisen aan data integratie en de infrastructuur van ICT. Een REST API moet Cloud Computing klanten goede performance, schaalbaarheid, eenvoud, aanpasbaarheid, zichtbaarheid, overdraagbaarheid en betrouwbaarheid van data en applicaties garanderen. Terwijl SOI niet het hele spectrum van de gewenste eigenschappen beslaat werd het wel een enabler 2 http://www.jambo-consultancy.nl
Data Integratie voor wat beter bekend staat als Service Oriented Cloud Computing Infrastructuur (SOCCI).
SOCCI kan worden gedefinieerd als een service-oriented, utility-based, beheers-, schaalbaar, On-Demand infrastructuur die de essentiële Cloud Computing Karakteristieken, Service en Implementatie modellen van het National Institute of Standards and Technology (NIST) ondersteund. In andere woorden, SOCCI beschrijft de essentie van data integratie en beheer van ITaaS omgevingen. Lees er meer over in Cloud Computing Standaard en REST API http://issuu.com/jamboflip/docs/cloud_computing_standaard_en_rest_a Het standaardiseren en specificeren van Use Cases rond het inzetten, stoppen, starten en updaten van ITaaS vergroot applicatie integratie van verschillende ITaaS aanbieders en dit verkleint weer de kans op Vendor Lock-In. Het ligt in de lijn der verwachting dat er Plug-Ins of “Management API’s” komen voor deze Use Cases voor ontwikkelomgevingen (ADE’s). Leveranciers zullen alleen hierin gaan investeren i.p.v. maatwerk integratie oplossingen. In het verleden is gebleken dat na verloop van tijd meer algemene, standaard applicatie en data integratie implementaties alle aandacht krijgen en van grotere kwaliteit zijn dan de implementaties geschreven voor specifieke en eigen applicatiebeheer interfaces. In deze brochure alle leveranciers van data integratie tools. Allereerst de leveranciers die er volgens Gartner de beste visie op na houden. Gebruik het selectietool aan het einde om uw eigen tactische keuze op basis van 10 selectiecriteria voor Enterprise Information Integration te maken. Kijk voor strategische Cloud Computing leverancierskeuze op www.jambo-consultancy.nl .
3 http://www.jambo-consultancy.nl
Data Integratie
Data Integratie 1
Functie van (On Premises) Data Integratie
Omschrijving/Doel
• Data acquisitie voor business intelligence (BI), analytics en data warehousing; van data informatie maken.
Extraheren van gegevens uit operationele (ERP)systemen, het transformeren en samenvoegen van die gegevens en het leveren van een geĂŻntegreerde datastructuur voor analytische doeleinden. BI en data warehousing blijven vooralsnog de bron van de vraag naar dataintegratie instrumenten. De verscheidenheid van de gegevens en de context voor analytics neemt toe als opkomende technieken, zoals Hadoop voor
4 http://www.jambo-consultancy.nl
Data Integratie
2
• Consolidatie en levering van stamgegevens ter ondersteuning van master data management (MDM)
3
• Bij gegevensmigratie/conversie
4
• Synchroniseren van gegevens tussen verschillende operationele applicaties
de ondersteuning van big data, in-memory database management systemen (DBMS) en de logische data warehouse architecturen, een steeds groter onderdeel vormen van de infrastructuur. Het inschakelen van de consolidatie en rationalisatie van de gegevens van bedrijfskritische entiteiten zoals klanten, producten en medewerkers. MDM is al dan niet op het zakelijk onderwerp gebaseerd en data-integratie tools kunnen worden gebruikt om de data consolidatie en synchronisatie processen vorm te geven die essentieel zijn voor het bedrijfssucces. Traditioneel meestal via de aangepaste codering van de conversie programma's. Data integratie tools worden in toenemende mate gebruikt voor het overzetten van data transformatie uitdagingen die inherent zijn aan de vervanging van legacy applicaties en consolidatie inspanningen als gevolg van bijv. fusies en overnames. Data integratie instrumenten bieden de mogelijkheid om op database level te zorgen voor consistentie tussen softwaresystemen, zowel intern en op een Inter-Enterprise basis (bijv. de verschillende gegevensstructuren van SaaS of voor gegevensbronnen in de Cloud, IaaS) op een bi- of unidirectionele manier.
5 http://www.jambo-consultancy.nl
Data Integratie 5
• Inter-Enterprise gegevensuitwisseling
Organisaties worden steeds vaker verplicht om gegevens te verstrekken aan externe handelspartners (klanten, leveranciers, zakenpartners, overheden en anderen) of deze te ontvangen. Data integratie tools zijn hierbij vaak betrokken.
6
• Levering van datadiensten in een
Een architecturale techniek; in plaats van het gebruik van data integratie zelf zijn datadiensten een opkomende trend voor de rol en de implementatie van data integratie binnen SOA's. Data integratie tools zullen in toenemende mate in staat zijn om vele soorten datadiensten (services) te leveren via Cloud Computing.
Service Oriented Architectuur (SOA) of SOI of SOCCI context.
6 http://www.jambo-consultancy.nl
Data Integratie
Er bestaan zo’n 10 verschillende soorten diensten die de leveranciers van data integratie tools aanbieden. Steeds vaker worden deze diensten op een Pay-per-Use basis en als een ITaaS of Cloud Computing dienst (definitie NIST) aangeboden. Deze 10 dienstcategorieÍn vallen uiteen in; 1. Connectiviteit 2. Capaciteit 3. Transformatie 4. Modellering 5. Omgeving 6. Beheer 7. Ondersteuning in brede zin 8. Administratie 9. Integratie 10. Diensten
7 http://www.jambo-consultancy.nl
Data Integratie
1. Connectiviteit/adapter mogelijkheden (bron en doel ondersteuning). De mogelijkheid om met verschillende soorten gegevensstructuren te kunnen werken zoals: o Relationele databases o Legacy en niet-relationele databases o Verschillende bestandsformaten o XML o Packaged applicaties, zoals CRM en supply chain management o SaaS en cloud-gebaseerde applicaties en bronnen o Industrie-standaard bericht formats, zoals elektronische gegevensuitwisseling (EDI), Swift en Gezondheid Level Seven International (HL7) o externalized parallel distributed processing (zoals Hadoop Distributed File System [HDFS] en andere NoSQL-soort repositories) o Bericht wachtrijen, waaronder die welke door applicatie-integratie middleware producten en standaarden gebaseerde producten (zoals Java Message Service [JMS]) o Gegevens types van een minder gestructureerd karakter, zoals sociale media, e-mail, websites, Office-tools en content repositories o Emergent bronnen, zoals gegevens over de inmemory DBMS, mobiele platforms en ruimtelijke toepassingen.
De data integratie instrumenten ondersteunen de verschillende manieren van interactie inclusief: o Bulk aankoop en levering o Granular trickle-voer aankoop en levering o Gewijzigde data capture (CDC) - de mogelijkheid om gewijzigde gegevens te identificeren en te extraheren o Event gebaseerde acquisitie (time-based of data-valuebased)
8 http://www.jambo-consultancy.nl
Data Integratie
2. Leveringscapaciteit; de mogelijkheid om gegevens, applicaties, processen en databases op verschillende manieren te kunnen benutten waaronder: o Fysieke bulk dataverkeer tussen data opslagplaatsen o In het geheugen vastgelegde eisen o Boodschap gerichte beweging via inkapseling o Replicatie van gegevens tussen homogene of heterogene DBMS en schema's.
Daarnaast is ondersteuning voor de verplichte aanlevering van gegevens van belang, zoals: o Geplande batch levering o Streaming/near-real-time levering o Event-driven levering van gegevens (op basis van identificatie van een relevante gebeurtenis)
3. Gegevenstransformatie; ingebouwde mogelijkheden voor het realiseren van meer of minder complexe data transformatie zoals; o Basis transformaties: data type conversies, stringmanipulaties en eenvoudige berekeningen o Matig complexe transformaties, zoals lookup en vervangen, samenvoegingen, opsommingen, deterministische matching en het beheer van langzaam veranderende dimensies o Complexe transformaties, zoals geavanceerde parsing operaties op free form tekst en rich media
Daarnaast moet de tools faciliteiten bieden voor het ontwikkelen van eigen transformaties en uitbreiding van aangeboden type transformaties
9 http://www.jambo-consultancy.nl
Data Integratie
4. Metadata en datamodellering; wordt van alle integratie mogelijkheden steeds belangrijker, dit omvat: o Geautomatiseerd zoeken naar en verwerven van metagegevens uit gegevensbronnen, applicaties en andere hulpmiddelen o Relatie tussen datamodellen en bedrijfskritische proces modellen o Gegevensmodel creatie en onderhoud o Fysieke om logische model en rationalisatie o Het definiĂŤren van model-tot-model relaties via grafische middelen op attribuut niveau o Afkomstbepaling en impactanalyse rapportages, via grafische- en tabelvorm o Een open metadata repository met de mogelijkheid om metadata bidirectioneel en met verschillende instrumenten te benaderen. o Geautomatiseerde synchronisatie van metadata over meerdere soorten tools o Mogelijkheid om de metadata repository uit te breiden met de klant gedefinieerde metadata attributen en relaties o Documentatie van het project met definities en design principes ter ondersteuning vandefinitie activiteiten en eisen o Zaken tussen analyse en de end-user interface te bekijken en te werken met metadata
5. Ontwerp- en ontwikkelingomgeving; voorzieningen voor data integratie processen waaronder: o Grafische weergave van gegevensopslagobjecten, datamodellen en datastromen o Workflow management voor het ontwikkelingsproces o Rolgebaseerde beveiliging o Team-based ontwikkelmogelijkheden, zoals versiebeheer en samenwerking o Functionaliteit voor hergebruik o Ondersteuning voor het testen en debuggen
10 http://www.jambo-consultancy.nl
Data Integratie
6. Beheren van gegevens (profiling en mining): maw mechanismen voor de borging van kwaliteit van gegevens over tijd met inbegrip van interoperabiliteit: o o o
Data profiling tools Data mining tools Data quality tools
7. Toepasbaarheid en runtime mogelijkheden van het platform: de hele breedte van ondersteuning voor hardware en besturingssystemen waarop de data integratie processen kunnen worden ingezet; o Mainframe omgevingen, zoals IBM z / OS en z / Linux o Midrange omgevingen, zoals IBM System i (voorheen AS/400) of HP Tandem o Unix omgevingen o Windows omgevingen o Linux omgevingen o Traditionele On Premises (bij de klant) installatie en implementatie van software o IaaS Cloud implementatie ondersteuning als een multi-tenant implementatie o PaaS, Platform as a Service (geleverd en geconsumeerd als een cloud service waar klanten niet nodig om software te implementeren in cloud-infrastructuur) o In-Memory infrastructuur o Server virtualisatie (ondersteuning voor gedeelde, gevirtualiseerde implementaties) o Parallelle processing (zoals Hadoop en MapReduce)
11 http://www.jambo-consultancy.nl
Data Integratie
8. Transactie en administratie: voorzieningen voor het inschakelen van continue ondersteuning voor beheer, toezicht en controle van de data integratie processen door de tools zoals; o Error handling functionaliteit, zowel vooraf gedefinieerde en aanpasbare o Toezicht en controle van de runtime processen, zowel via functionaliteit in de tools en haar interoperabiliteit met andere IT technologieĂŤn
o Het verzamelen van runtime statistieken om het gebruik en efficiency, alsmede een applicatie interface voor visualisatie en evaluatie te bepalen o Beveiligingscontroles, zowel voor, tijdens en als beheerder processen o Een runtime architectuur die de prestaties verbetert en schaalbaarheid verzekert
9. Architectuur en integratiemogelijkheden; de mate van gemeenschappelijkheid, samenhang en interoperabiliteit tussen de verschillende onderdelen van de data-integratie toolset inclusief: o Een minimaal aantal producten (idealiter 1) die alle data modes ondersteunen o Gemeenschappelijke metadata (1 repository) en /of de mogelijkheid om metadata te delen over alle componenten en de levering van gegevens o 1 gemeenschappelijke ontwerpomgeving die alle data modellen kan ondersteunen
o De mogelijkheid om naadloos te schakelen tussen levering (bulk of batch vs partiele, realtime vs gezamenlijke) met minimaal nawerk o Interoperabiliteit met andere integratie tools en applicaties, via gecertificeerde interfaces en robuuste API's o EfficiĂŤnte ondersteuning voor alle datamodellen, ongeacht het runtime architectuur (centrale serverengine vs verdeeld en runtime)
12 http://www.jambo-consultancy.nl
Data Integratie
10. Diensten voor diensten; als het idee van ICT als dienst (ITaaS) blijft groeien moeten toekomstige data integratie tools ook servicegerichte kenmerken zoals bijv. Pay per Use en ondersteuning voor SOA bieden: o De mogelijkheid om alle aspecten van de runtime functionaliteit in te zetten als datadienst o Beheer van publicatie en het testen van deze datadiensten
o Interactie met service repositories en registers o services enablement in ontwikkeling- en beheeromgevingen, zodat externe hulpmiddelen en toepassingen dynamisch kunnen worden aangepast en ook het runtime gedrag van deze tools
13 http://www.jambo-consultancy.nl
Data Integratie
De Leiders enVisionairs Actian-Pervasive Software
producten
Adeptia
Actian-Pervasive (verworven in April 2013), gevestigd in Redwood City, CaliforniĂŤ is al sinds 1982 een bekende in de data integratie tool markt. Gefocussed op de specifieke aspecten van de totale data integratie markt, biedt zij een Real-Time messaging oplossingen en bulk/batch gegevenstransfer. Zij biedt diverse connectiviteit voor data bronnen en -doelen en ondersteunt de industriestandaard voor berichtindelingen . Een zinvol samengaan met Actian die ook recent ParAccel kocht voor haar App strategie (mn inbedded analytics). Data Integrator, DataCloud en DataRush. De DataRush technologie zorgt ervoor dat er continu data voor actuele analyse is door het beweegt door een data service bus en voor de snelle toewijzing van de nieuwe gegevens voor nieuwe analytische berekeningen. Adeptia biedt haar hele assortiment aan data integratie functies in 1 enkele toolset zodat de complexiteit vermindert. Dit stroomlijnt het hele proces van integratie activiteiten en processen, zoals data mapping, stroomontwerp en gedeelde data definities en use cases. 14 http://www.jambo-consultancy.nl
Data Integratie Klanten bevestigen het gebruiksgemak en het vermogen van de tool om alle medewerkers te laten participeren bij het opbouwen en onderhouden van integratieprocessen die zijn afgestemd op hun specifieke behoeften. Adeptia ondersteunt de belangrijkste data integratie functies in de hele breedte; van connectiviteit en adapters, bulk/batch data levering en ongestructureerde data capture en vermeerdering. product
Overspant zowel data integratie en applicatie integratie. Via een multidisciplinair instrumenten platform, Adeptia's EBIM Suite, biedt het een omgeving voor data integratie mogelijkheden samen met het platform een enterprise service bus en business process management functies. Dit komt overeen met een grotere vraag naar ondersteuning van data integratie activiteiten, zodat teams meerdere integratie infrastructuren op een synergetische manier naadloos kunnen implementeren.
Composite Software Composite Software koos een weloverwogen en zeer gerichte marktbenadering door Cisco heeft een bod op Composite Software gedaan producten
IBM
producten
eerst specifieke niches te identificeren en data integratieproducten voor deze gebieden te ontwikkelen. Deze functionaliteit om specifieke problemen met uniek oplossingen vervolgens weer te vertalen naar een meer gemeenschappelijke aanpak (in vergelijking met andere vormen van data integratie tools.) Composite Data Virtualization Platform (bestaande uit Composite Information Server, Composite Discovery en adapters voor toegang tot gegevensbronnen), Composite Active Cluster and Composite Discovery. IBM speelt een sleutelrol bij Cloud Computing en haar tools worden vaak ingezet als een bedrijfsbrede standaard. De reikwijdte en omvang van de implementaties zijn vaak groot en de meeste van haar 9600 klanten hebben gemiddeld 10 IBM ontwikkelaars in dienst.. IBM levert een zeer uitgebreide reeks data integratie functionaliteit tools, waaronder bulk/batch data bewegingen (ETL), CDC en vermeerdering, data replicatie en data virtualisatie. De 2013 producten routekaart richt zich op meer technische verbeteringen voor Hadoop en Cloud Computing ondersteuning evenals focus op voortdurende prestatieverbeteringen en integratie met andere “InfoSphere� toepassingen zoals Informatie Life Cycle Management. IBM InfoSphere Information Server Enterprise Edition (inclusief InfoSphere Information Server for Data Integration, InfoSphere Information Server voor Data Quality en InfoSphere Business Information Exchange), InfoSphere DataStage, InfoSphere Federation Server, InfoSphere data replicatie en WebSphere Cast Iron Cloud Integration.
15 http://www.jambo-consultancy.nl
Data Integratie
Informatica
product
Microsoft
producten
Oracle
De kern van Informatica's platform is de mogelijkheid om centraal te ontwerpen en implementeren voor in gebruikname op vele verschillende platformen. Deze architectuur noemt Informatica een "virtuele data machine" (Vibe), en hiermee kunnen klanten mappings en transformaties uitvoeren die vervolgens kunnen worden ingezet op verschillende runtime platforms (inclusief opkomende big data technologieën zoals Hadoop). Ongeacht het onderliggende platform zijn deze processen gebaseerd op een en dezelfde Informatica kennis en vaardigheden. Hetzelfde concept geldt voor cloud, hybride of andere cloud combinaties implementaties. Dit is in lijn met het concept van gemeenschappelijke (platformonafhankelijk) data integratie mogelijkheden die nodig zijn voor de moderne informatie infrastructuren. Informatica Platform (inclusief: PowerCenter, PowerExchange, Data Services, data replicatie, Ultra Messaging, B2B Data Exchange en Cloud Data Integration). Het klantenbestand voor dit product wordt geschat op meer dan 5.000 bedrijven. Net zoals in de afgelopen jaren behoren Microsoft producten tot de meest bekende en goedkoopste aanbieders van tools voor interfaces, ontwikkeling en data integratie functionaliteiten. Zodra Microsoft SQL Server eenmaal is ingezet in gerelateerde use cases, zoals data marts, data warehouses, operationele data stores en zelfs applicatie integratie diensten (in combinatie met BizTalk Server interfaces) wordt overstappen een moeilijke/dure aangelegenheid. Microsoft heeft ten doel gesteld de user-driven data integratie activiteiten die gebruik maken van het onderliggende SSIS met verschillende andere gegevensbronnen te verbeteren. Microsoft biedt een andere verdienmodel dan de meeste enterprise class concurrenten; een die zich richt op de TCO en gebruiksgemak. SQL Server Integration Services (SSIS; aangeboden via de SQL Server DBMS-licentie) en BizTalk Server. Deze producten worden door meer dan 13.000 bedrijven gebruikt. Oracle staat in deze markt bekend als de complete leverancier voor alle mogelijke dataintegratie en andere data management functionaliteiten zoals de kwaliteit van de gegevens en MDM oplossingen. ODI biedt mogelijkheden voor bulk/batch data bewegingen en Oracle GoldenGate centra op CDC en Real-Time levering van gegevens. Oracle Data Service Integrator levert data gezamenlijke/virtualisatie mogelijkheden. Met deze primaire data integratie producten, samen met de bericht georiënteerde functionaliteit van Oracle’s WebLogic Suite, kan zij aan elke vorm van data integratie voldoen. Oracle’s GoldenGate kracht is haar bedrijfskritische data replicatie en synchronisatie in heterogene data en applicatie omgevingen. Het product portfolio van Oracle streeft naar verdere integratie tussen ODI en GoldenGate's, optimalisatie van replicatie werkdruk door In-Memory management en het geïntegreerd gebruik van data 16 http://www.jambo-consultancy.nl
Data Integratie producten
SAP
producten
SAS
product
integratie toolset met data kwaliteit en MDM-mogelijkheden te verbeteren. Oracle Data Integrator (ODI), Oracle Data Service Integrator, Oracle GoldenGate en Oracle Warehouse Builder (OWB). Haar klantenbestand voor dit product wordt geschat op ongeveer 3.800 bedrijven. De visie van een SAPs Real-Time dataplatform maakt gebruik van In-Memory computingprestaties van SAP Hana en biedt ondersteuning voor logische data warehouse architecturen en big data initiatieven. SAP functioneert als een runtime platform met SAP Data Services, dat weer goed integreert met oog voor datakwaliteit en tekst data processing mogelijkheden samen met data integratie functionaliteit. Verbeterde ondersteuning voor samenwerking tussen data integratie ontwikkelaars en data stewards faciliteert de synergie tussen data integratie en governance procesinformatie. De nadruk wordt gelegd op het verbeteren van SAP data integratie tooling voor niet-SAPomgevingen. Data integratie tools van 3th parties zijn de sleutel tot klanten die goedkope integratie van hun SAP systeem met niet SAP gegevensbronnen ambieren. SAP Data Integrator, SAP Data Services, SAP NetWeaver Process Orchestration, SAP Sybase Replication Server en SAP Hana Cloud Integration voor Data Services, zo’n 11000 klanten. "Het Zwitserse zakmes" onder de data integratie tools met veel “self-servicel" en voldoende "eenvoud". Ook inbegrepen is een PIG bibliotheek met vooraf gedefinieerde transformaties en ODBC toegang tot Hive voor Hadoop ondersteuning en zo ook MapReduce verwerking toestaat. SAS kent sterk geïntegreerde data profiling mogelijkheden die data transformatieprocessen kunnen beinvloeden. Dit biedt mogelijkheden voor het definieren van controle opdrachten die zijn gebaseerd op de analyse van incrementele gegevens die door de data integratieproces vloeien. Zo kunnen architecten en gebruikers belangrijke data problemen in goede banan leiden. Het houdt verkeerde data uit de analyse. SAS biedt ook een entiteit en objectmodellering, reverse engineering en ontwikkeling van de modellen op basis van data profiling. De leverancier heeft Web kijkers die kunnen worden ingebed in analytic applicaties, profielen en datakwaliteit metrics. Een andere toepassing van metadata is te vinden in de data sanering functionaliteit, die data vraagstukken belicht, alerts creëert en workflows om problemen aan te pakken beheert. Data Management Platform, Federation Server en SAS/Access. Deze leverancier heeft meer dan 13.000 klanten.
17 http://www.jambo-consultancy.nl
Data Integratie
Syncsort
product
Talend
product
Hoewel partnerships met leveranciers voor een uitgebreide functionaliteit zorgen (bijvoorbeeld Attunity voor CDC en Trillium Software voor data kwaliteit) is Syncsort zeer ETL-centrisch. Lagere TCO vergeleken met marktleiders en het gebruiksgemak zijn de belangrijkste punten van Syncsort DMExpress. Een korte leercurve voor gebruik, maatwerk mogelijkheden en eenvoudige administratie tools zijn haar belangrijkste extra’s. De nieuwste release van DMExpress (gebrandmerkt als DMX) is een op Hadoop gebaseerd aanbod (DMX-h ETL Edition en DMX-h Sorteren Edition) en ondersteunt voor het inschakelen van de ontwerpen van data integratie processen op Hadoop. Talend biedt staat bulk/batch data integratiemogelijkheden die een hoge mate van rijpheid kent en die geschikt is voor een aanzienlijk deel van de markt. Bijkomende functionaliteit bestaande uit data kwaliteit, MDM, business process management en een enterprise service bus zijn goed geïntegreerd en bieden klanten de mogelijkheid om een breder scala van data management initiatieven te ondersteunen als ze dat willen. Talend richt zich nu sterk op Hadoop en NoSQL andere gegevensbronnen; een poging om te profiteren van de huidige opwinding rond big data via uitgebreide mogelijkheden voor het genereren van MapReduce code, interactie met Hive, en integratie met opkomende databasetechnologieën zoals Cassandra en MongoDB. De product roadmap bevat ook een grote nadruk op publieke cloud implementaties via Amazon Elastic Compute Cloud (Amazon EC2). Talend Open Studio voor Data Integration, Talend Open Studio voor Big Data en Talend Enterprise Data Integration. De leverancier wordt geschat op meer dan 3.000 klanten.
En Alle Anderen…
18 http://www.jambo-consultancy.nl
Data Integratie
• Ab Initio, Lexington , Massachusetts ( www.abinitio.com ) Biedt een applicatieontwikkelingstoolbox ( Co> Operating System ) en een componenten bibliotheek voor metadata beheer en data integratie . • Alebra Technologies, New Brighton , Minnesota ( www.alebra.com ) Biedt parallelle gegevensoverdracht voor cross-platform omgevingen met file en database kopiëren en delen. • Apatar, Walnut , Californië ( www.apatar.com ) Zorgt voor open source data integratie instrumenten gericht op ETL (extractie, laden, transformatie) en data synchronisatie scenario's . • Arbutus Software, Burnaby , British Columbia , Canada ( www.arbutussoftware.com ) Biedt oplossingen voor mainframe legacy data connectiviteit en toegang, ter ondersteuning van data integratie en andere zaken. • Astera Software, Simi Valley , California ( www.astera.com ) Zorgt voor ETL , CDC en B2B data integratiemogelijkheden via het CEnterprise Data Integrator product . • Ataccama, Stamford , Connecticut, en Praag, Tsjechië ( www.ataccama.com ) Biedt bulk laders voor de industrie standaard databases management systemen zoals Oracle DBMS en Microsoft SQL Server. 19 http://www.jambo-consultancy.nl
Data Integratie • Attunity, Burlington , Massachusetts ( www.attunity.com ) Biedt een breed scala aan data integratie producten, waaronder adapters (Att. Connect), CDC (Att. CDC), replicatie (Att. repliceren), data samenvoeging ( Att. gezamenlijke) en data- bewegingen waarbij cloud gebaseerde data structuren (Att.CloudBeam) voor verschillende database- en bestandstypen . • Axway, Phoenix ( www.axway.com ) Biedt software en diensten, zoals B2B data integratie ter ondersteuning van verschillende gegevensbronnen waaronder varianten van XML en EDI . • BackOffice Associates, South Harwich , Massachusetts ( www.boaweb.com ) Biedt diensten en technologie; het Data Stewardship Platform levert data integratie voor migraties met een focus op SAP en andere ERP systemen. Het HiT Software merk biedt de leverancier databasereplicatie (DBMoto), databank-to -XML transformatie en mapping (Allora) en DB2 connectivity producten . • BIReady, New York en Langbroek , Nederland ( http://biready.com ) Biedt een dynamisch model en tool voor vormgeving, implementatie en invulling van analytische modellen in combinatie met een data integratie engine voor transformaties tussen modellen.
20 http://www.jambo-consultancy.nl
Data Integratie • C3 Business Solutions, Melbourne , Australia ( www.c3businesssolutions.com and www.c3integrity.com ) Biedt diensten en technologie door middel van een vereenvoudigde set van tools voor het consolideren van data, het valideren van gegevens en het verkrijgen van gegevens uit bronnen, zoals Excel, Access , CSV, vaste breedte en de XML standaard dataformaten . • CDB Software, Houston ( www.cdbsoftware.com ) CDB/Delta biedt CDC en replicatie mogelijkheden voor IBM DB2 op z/OS-platform . • DataRoket, Washington, DC ( www.dataroket.com ) Biedt ETL en data samenvoeging via het DataRoket product suite . • Datastromen, Seoul, Korea ( www.datastreams.co.kr ) Biedt mogelijkheden voor ETL , CDC en bijna real time integratie van gegevens via een waaier van producten waaronder TeraStream en DeltaStream . • Datawatch, Chelmsford , Massachusetts ( www.datawatch.com ) Het Datawatch Pump product biedt ETL functionaliteit en ondersteuning voor het extraheren van gegevens uit tekstrapporten, PDF bestanden, spreadsheets en andere, mindere gestructureerde, gegevensbronnen. • DBSync, Brentwood , Tennessee ( www.mydbsync.com ) Biedt een DBSync integratieplatform voor de integratie van gegevens tussen databases en applicaties via On-Premise en On Demand modellen.
21 http://www.jambo-consultancy.nl
Data Integratie • Dell Boomi, Berwyn , Pennsylvania ( www.boomi.com ) Een business unit van Dell, Boomi levert technologie voor integratie van data naar en tussen SaaS gebaseerde applicaties en gegevensbronnen. • Denodo Technologies, Palo Alto , Californië , Madrid en Londen ( www.denodo.com ) Het Denodo Platform biedt data samenvoeging, data virtualisatie en mashup mogelijkheden voor het samenvoegen van gestructureerde gegevensbronnen met gegevens van websites, documenten en andere minder gestructureerde repositories. • DFI, Co Dublin ( www.datafusion.ie ) Een data en inhoud fusion technologie. De Infinity oplossing ondersteunt een benaderingen van data integratie door samensmelten van data. • Diyotta, Charlotte , North Carolina ( www.diyotta.com ) Richt zich op ELT stijl workloads met hefboomwerking en parallelle gedistribueerde verwerkingsarchitecturen en database toestellen via de Diyotta Data Integration Suite . • Elastic Intelligence, Menlo Park , Californië ( www.connectioncloud.com ) The Connection Cloud ondersteunt toepassingen of hulpmiddelen die SaaS gegevensbronnen verbinden met behulp van SQL en biedt mogelijkheden voor het bundelen van cloud gegevensbronnen om toegang vanaf een enkele virtuele server in te schakelen.
22 http://www.jambo-consultancy.nl
Data Integratie
• ETI, Austin , Texas , een Versata Application Development bedrijf ( www.versata.com en www.eti.com ) De ETI oplossing heeft een op code generatie gebaseerde architectuur gericht op bulk/batch data bewegingen. • ETL Solutions, Bangor , UK ( www.etlsolutions.com ) Transformation Manager biedt een metadata toolset voor autorisaties, testen, debuggen en implementeren van diverse data integratie eisen . • Extol, Pottsville , Pennsylvania ( www.extol.com ) Extol Business Integrator ( EBI ) maakt data en applicatie integratie in heterogene omgevingen mogelijk Voor het ondersteunen van het gebruik voor BtoB, applicatie, data en cloud integratie . • Gamma Soft, Ivry sur Seine, Frankrijk ( www.gamma-soft.com.com ) Ondersteunt CDC en replicatie van gegevens voor verschillende heterogene gegevensbrontypen via het data distributie product . • GSS Group, Markham , Ontario , Canada ( www.gssgrp.com ) Biedt Vigiliance XPress, een web oplossing voor SQL Server datamarts ondersteuning van Microsoft NET Framework en het maakt extractie van gegevens uit verschillende ERP en DBMS bronnen mogelijk. • GT Software, Atlanta ( www.gtsoftware.com )
23 http://www.jambo-consultancy.nl
Data Integratie The Ivory Suite productlijn ondersteunt connectiviteit en integratie met verschillende soorten mainframe gegevensbronnen. • HVR Software, Amsterdam , Nederland ( www.hvr-software.com ) Biedt het HVR Real-Time Data Integration product en ondersteunt CDC en uitbreiding en replicatie patronen van verschillende gegevensbronnen en typen platformen . • Innovatieve Routines International De CoSort Co, Melbourne , Florida ( www.iri.com ) Snelle Extractie en SortCL tools voor het snel omzetten van gegevens in bulk/batch en CDC met DBMS en platte bestanden en gegevensmanipulatie voor ETL en big data . • Irion, Turijn , Italië ( www.iriondq.com ) Ondersteunt connectiviteit naar DBMS en mainframe bestanden door het opstellen van gezamenlijke standpunten van gegevens uit heterogene bronnen in en buiten de organisatie als onderdeel van een datakwaliteit en governance kader. • iZenda, Atlanta ( www.izenda.com ) Biedt iZenda Fusion leveren van data samenvoeging/virtualisatie mogelijkheden die Real-Time data toegang tot diverse gegevensbronnen voor analytics gebruikt ondersteunen. • Javlin , Arlington , Virginia ( www.javlininc.com en www.cloveretl.com ) Biedt de CloverETL product voor het bouwen, implementeren en monitoren van data integratie processen ter ondersteuning van analyses en embedded gebruik in zakelijke applicaties . 24 http://www.jambo-consultancy.nl
Data Integratie • Jitterbit , Oakland , Californië ( www.jitterbit.com ) Biedt software voor On-Premise en op Cloud Computing gebaseerde modellen, met een focus op applicatie integratie (event en message based ) en data integratie . • JumpMind , Columbus , Ohio ( www.jumpmind.com )– Het Open-Source SymmetricDS product reeks biedt data replicatie mogelijkheden voor een verscheidenheid aan relationele DBMS omgevingen . • Kapow Software, Palo Alto , Californië ( www.kapowsoftware.com ) Kapow Katalyst en Kapow KappZone ondersteunen data integratie en de creatie van integratie workflows van data en content op On-Premise en cloud gebaseerde applicaties, websites, big databronnen en inhoudbeheer van repositories . • Kinetische Netwerken, San Francisco ( www.kineticnetworks.com en www.ketl.org ) Ondersteunt ETL via Ketl , een Open-Source data integratie tool. • Metatomix , Austin , Texas , een Versata Application Dev. bedrijf ( www.versata.comand www.metatomix.com ) Biedt de Metatomix ERI platform met een op semantiek gebaseerde aanpak voor het creëren van data services en gezamenlijke standpunten van gegevens over meerdere data bronnen . • MioSoft , Madison , Wisconsin ( www.miosoft.com ) Ondersteunt data extractie en transformatie, met de mogelijkheid om gegevens te publiceren en bestanden, relationele DBMS omgevingen en messaging infrastructuur door MioBDT 25 http://www.jambo-consultancy.nl
Data Integratie alsmede via een cloud gebaseerd platform , MioEdge . • Nimaya , Washington , DC ( www.nimaya.com ) ActionBridge technologie maakt virtuele samenvoeging van gegevens tussen On-Premise en SaaS-gebaseerde gegevensbronnen . • Pentaho , Orlando , Florida ( www.pentaho.com en kettle.pentaho.com ) Biedt data integratiemogelijkheden via de Pentaho Data product integratie en door gebruik te maken van het Kettle Open-Source project om het gebruik van gegevens te ondersteunen binnen diverse omgevingen, waaronder relationele en NoSQL DBMS, ERP systemen en big data bronnen. • Pitney Bowes Software , Stamford , Connecticut ( www.pb.com/software ) Klantcommunicatie met de Pitney Bowes software en services biedt mogelijkheden voor de ondersteuning van bulk data bewegingen via Sagent Data Flow en Spectrum Technology Platform . • Progress Software , Bedford , Massachusetts ( www.progress.com )– De Data Integration Suite van de verkoper DataDirect productlijn biedt toegang tot de gegevens replicatie en synchronisatie mogelijkheden . • QlikTech , Radnor , Pennsylvania ( www.qlikview.com ) Biedt het QlikView expressor product op basis van een semantische benadering voor het ontwerpen en beheren van data integratie processen . 26 http://www.jambo-consultancy.nl
Data Integratie • Quest Software , Aliso Viejo , Californië ( www.quest.com ) Verworven door Dell in 3Q 12 , Quest Software SharePlex biedt Real-Time replicatie ondersteuning voor Oracle DBMS omgevingen en is vooral gericht op high-availability toepassingen . • Red Hat, Raleigh , North Carolina ( www.redhat.com en www.jboss.org/teiid ) – De producten ondersteunen het maken van datamodellen en model-driven, gezamenlijke, weergaven van gegevens (zie Cloud Computing leveranciers). • Redpoint , Wellesley Hills , Massachusetts ( www.redpoint.net ) Redpoint Data Management biedt bulk/batch stijl data bewegingen samen met de standaard ingebouwde tools voor normalisatie en correctie van gecombineerde ondersteuning van data integratie en datakwaliteit . • Relational Solutions , Westlake , Ohio ( www.relationalsolutions.com ) De BlueSky Integratie Studio biedt ETL mogelijkheden in een vereenvoudigde low-cost toolset die op een Windows omgeving draait . • Safe Software , Surrey , British Columbia , Canada ( www.safe.com ) De Feature Manipulation Engine (FME) technologieplatform levert ETL mogelijkheden voor ruimtelijk gespreide gegevensbronnen; vaak gebruikt voor geografisch informatiesystemen . • Scribe , Manchester , New Hampshire ( www.scribesoft.com ) – 27 http://www.jambo-consultancy.nl
Data Integratie De Scribe Insight product levert data migratie en integratie voor de ondersteuning van implementaties van zakelijke toepassingen met een focus op Microsoft Dynamics . Scribe Online ondersteunt integratie met cloud data . • Sesam Software , Los Angeles ( www.sesamesoftware.com ) Biedt de Relationele Junction product suite voor synchronisatie van gegevens tussen SaaS applicaties met een focus op ETL georiënteerde patronen van integratie . • SnapLogic , San Mateo , Californië ( www.snaplogic.com ) Biedt Real-Time en gezamenlijke integratie van data met een focus op diverse gegevensbronnen waaronder SaaS en cloud gebaseerde bronnen en een via het web gerichte architecturale aanpak . • Software AG , Darmstadt , Duitsland ( www.softwareag.com ) De CentraSite product levert data en metadata samenvoegingmogelijkheden en is gericht op SOA implementaties. Integratie Platform Software AG biedt procesgerichte integratiemogelijkheden . • SQData , Addison , Texas ( www.sqdata.com ) De SQData productlijn biedt data replicatie, CDC en ETL functionaliteit gericht op mainframe gegevensbronnen en relationele DBMS . • Stone Bond , Houston ( www.stonebond.com ) Ondersteunt zowel gezamenlijke/gevirtualiseerde data integratie en fysieke gegevens 28 http://www.jambo-consultancy.nl
Data Integratie bewegingen via de Enterprise Enabler technologie set . • Sypherlink , Worthington , Ohio , een dochteronderneming van Saama Technology ( www.sypherlink.com ) Biedt metadata onderzoek en het in kaart brengen ervan via Harvester en de toegang tot databronnen voor het creëren van geïntegreerde posities via Harvester Integrator . • Tervela , Acton , Massachusetts ( www.tervela.com ) Tervela gegevens Fabric ondersteunt het vastleggen, delen en verspreiden van gegevens van bedrijven en cloud gegevensbronnen voor analytisch gebruik en kunnen zo low-cost zorgen voor latency databewegingen. • Vision Solutions , Irvine , Californië ( www.visionsolutions.com ) Real-Time database replicatie functionaliteit wordt verzorgd door het Double-Take Share product . • WhereScape , Portland , Oregon ( www.wherescape.com ) WhereScape ROOD biedt snelle creatie en het onderhoud van data warehouses met inbegrip van ETL functionaliteit .
Maak een gefundeerde keuze met Jambo’s Analyse tool. https://docs.google.com/file/d/0BwiU--xkIhGqZU9jeGxsTms1dmM/edit?usp=sharing
29 http://www.jambo-consultancy.nl