<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=&amp;ev=PageView&amp;noscript=1">
Luk her
Direkte

Morgendagens krav til en dataplatform

Mange som har arbejdet med dataplatforme i en årrække, enten som løsningsansvarlige eller på sidelinjen som brugere, har oplevet en modsætning imellem innovation med data og den klassiske tilgang til Data Warehouseprojekter i 00’erne. Historien om de store Data Warehouse-projekter med en lang kravspecificeringsfase og endnu længere udviklingstid skræmmer og gør sammen med nutidens behov for større agilitet, at en dataplatform i dag også skal kunne understøtte agil innovation med data. Mange organisationer kigger derfor på data lakes som en mere løs organisering af data med hurtigere tilgang for alle, hvor data kan placeres, og alle kan få tilgang til at lave deres egne analyser. 

Dette betyder dog ikke, at ønsket om ”one truth” forsvinder. Mange vil være nødt til at have en dataplatform med mulighed for ”datalaboratorier” eller ”sandkasser”, hvor de dygtige analytikere og Data Scientists kan arbejde frit med data. Samtidig vil de analyser og rapporter, som bruges til styring og opfølgning for ledelsen og forskellige databrugere, stadig skulle være robuste og fuldt understøttet af en fælles platform. Gartner Group taler om ”Bi-Modal BI” som dækker over netop dette dilemma: Vi ønsker at kombinere de to verdener og bruge datalaboratorier til at finde ny indsigt. Har denne indsigt værdi i forhold til gentagne analyser, så kan vi flytte den ind i en automatiseret tilgang, hvor den kan indgå i en fælles dataløsning. Oven i dette så har både teknologierne og projekttilgangen ændret sig betragteligt. Selv i det mere klassiske Data Warehouse-setup arbejder man langt hurtigere med blandt andet automatiseret udvikling og mere agilt mod de behov, forretningen har for analyser. Her er det erkendelsen af, at virksomheden ikke kender alle behov fra starten, der styrer en agil model for leverance. Man arbejder derfor med korte udviklingssprint og et meget tæt samarbejde med forretningen, hvor ønsker og behov udvikler sig sammen med den færdige løsning. Det er derfor vigtigt at vælge både en udviklingsmetode og en projektleverancemetode, der netop understøtter denne agile tilgang til levering af analyse og rapporteringsfunktionalitet til forretningen.

Et cloud dataplatformprojekt fra A – Z

Når man påbegynder et cloudbaseret dataplatformsprojekt, er der en række forhold som bør indgå i planlægningen sammen med det tekniske udviklingsprojekt for at sikre, at løsningen kan leveres succesfuldt: 

Etablering af arkitektur blueprint

Den første opgave tager udgangspunkt i de drivere, som jeres organisation har for en ny dataplatform. Der skal udarbejdes et arkitektur blueprint, som kan understøtte de forretningsbehov og fremtidige ønsker som ligger til grund for den nye platform. Ud over at sikre den nødvendige funktionalitet, så vil datamængder og opdaterings- og rapporteringsfrekvenser være vigtige parametre for, hvilke cloud services som skal indgå i løsningen. Der kan være forskellige tilgange til at løse den samme forretningsmæssige opgave, og når den optimale arkitektur vælges, indgår prissætningen på de enkelte services derfor også, så behov og omkostning kan balanceres mest optimalt.

Etablering af infrastruktur

Umiddelbart er etablering af infrastruktur i en cloudarkitektur en nem og hurtig opgave, hvis man sammenligner med installation og etablering af fysiske servere. Man skal dog være opmærksom på, hvilke tekniske platforme datakilderne baserer sig på, og om der i infrastrukturen er særlige forhold, man skal tage højde for, når data skal flyttes fra onpremise datakilder til en cloud dataplatform. Afhængig af datamængderne kan forhold omkring full data load og delta data load også fylde mere eller mindre i et samlet cloudbaseret dataplatformsprojekt.

Etablering af projektleverancemodel (forretningsinvolvering)

Uanset om teknologien, vi bygger en moderne dataplatform på, er cloudbaseret eller ej, så er det vigtigt at få etableret en god og tæt samarbejdsrelation mellem dem, der udvikler, og forretningen som har behovet for agilitet og innovation. Dette sikrer, at den forretningsmæssige værdi som skal komme ud af løsningen rent faktisk afspejler forretningens behov - og ikke hvad vi som udviklere tror, deres behov er. Igen afhængig af udgangspunktet kan her være en større eller mindre opgave i forhold til at sikre et godt løbende samarbejde i en model, hvor roller og ansvar er klart formuleret, og deltagerne dermed kan indgå i et samarbejde, som opleves som værdiskabende for alle parter.

Pilot/fase 0 implementering

Lidt afhængig af jeres organisations fundament kan der være behov for at starte et dataplatformsprojekt med en pilot eller et mindre fase 0 forløb, hvor man lærer teknologien at kende og afprøver og eventuelt tilpasser metoden samt projektleverancemodellen. Det kan især være formålstjenligt, hvis man har flere Data Warehouse-udviklere som skal lære den nye platform at kende. Dermed kan man sikre, at projektet starter med et begrænset scope og dermed understøtter en hurtig læring af tilgang til den nye teknologi fra datakilde til færdig dataplatform og dermed få aftestet hele arkitekturen.

Cloud services overvejelser

Der er en række overvejelser, man skal gøre sig, når man udvælger de cloud services, man ønsker at sammensætte til en løsning. Forretningsbehovet er som udgangspunkt der, hvor man starter, men som nævnt tidligere bør man også altid vurdere sine valg ud fra et økonomisk perspektiv. Er der services, man med fordel kan starte og stoppe efter behov for dermed at mindske omkostningerne for den samlede løsning, kan det være relevant at inddrage, når man vælger til og fra. Der er dog nogle typer af services som altid bør indgå i et initialt setup. Ud over komponenter til at etablere dataplatform indgår her f.eks. styring af sikkerhed, udviklingsværktøjer og monitorering. Generelt vil anbefalingen være at starte med et minimums setup for at udvide senere. Dette gælder både i forhold til brugerskaren og funktionalitet. Endvidere skal man sørge for at anvende rådgivning ved beslutninger relateret til valg af cloud service, så man sikrer, at det optimale mix af pris og funktionalitet vælges. Et andet opmærksomhedspunkt, man bør tage med, når man udvælger services og beregner sine omkostning, er, at cloud platformen udmærker sig ved konstant at udvikle sig, men det betyder også, at det er vigtigt at holde sig opdateret på mulige valg og prissætning af de enkelte services.

Er du interesseret i at vide mere om et cloudbaseret Data Warehouse?

Følg
Jyllands-Posten