Versjonskontroll Av Datavitenskapsløsninger

jeg kommer fra en akademisk bakgrunn, så når jeg snakker om hvordan versjonering gjøres innen datavitenskap, snakker jeg av erfaring. Men i løpet av min karriere har jeg finpusset mine ferdigheter som programvareingeniør, arkitekt og teknisk innovasjonsleder. Dette gir meg et unikt perspektiv på hvordan ting er og har blitt gjort, samt hvordan de kan gjøres bedre, mye bedre.

Data science arvet sin praksis med versjonskontroll fra akademia. Og denne tilnærmingen er hva de fleste beregningsmessige vitenskapelige felt har gjort i mange år. Ikke misforstå, datavitenskap gikk på denne måten i de tidlige digitale dagene (og i mange tilfeller er dette fortsatt utbredt i akademia), men har flyttet til mer avansert praksis.

Unngå Faux Versjonskontroll

Hva er denne praksisen? Det er praksisen med å lage’ versjons ‘ordninger gjennom’ smart ‘ fil navngiving. Disse ordningene produserer vanligvis følgende type filer

  • _new, _old, _old_new, _new_1, …
  • _1, _2, _1_1

denne tilnærmingen til versjonskontroll, som jeg refererer til som faux versjonering, er en sykdom, og den er endemisk. Men å bryte fra disse praksisene kan gjøres, og bør, som moderne praksis, som modellstyring, kreve det. Dette kan oppnås ved hjelp av et versjonskontrollsystem— VCS)-med en industripreferanse for en git-basert løsning.

gå med En Git-Basert VCS

Ved hjelp av en git-basert VCS med en passende forgreningsstrategi, kan du uforanderlig spore versjonen AV ML-modellene dine og andre gjenstander i livssyklusen for datavitenskapsutvikling. Men versjonering av kode, i motsetning til andre programvareutviklingsdisipliner, er nødvendig, men ikke tilstrekkelig.

Ytterligere problemer må vurderes:

  • versjonering av data
  • versjonering av modeller
  • modeling metadata storage
  • etc.

selv om disse ekstra bekymringene kan håndteres, vil en vaniljeimplementering ikke være tilstrekkelig på lengre sikt og kan forårsake mer skade enn hjelp. Hashmap kan hjelpe deg ned denne banen og få på plass en løsning som passer best til dine unike forretningsbehov.

Dette er en Del Av Den Utviklende Datavitenskapsserien.

Føl deg fri til å dele på andre kanaler og være sikker og holde tritt med alt nytt innhold fra Hashmap her. For å lytte inn på en uformell samtale om alle ting datateknikk og skyen, sjekk Ut Hashmaps podcast Hashmap på Trykk også På Spotify, Apple, Google og andre populære streaming apps.

hvis Du likte å lese dette, er Noen Av Johns andre nyere historier under:

John Aven, Ph. D., Er Direktør For Engineering Ved Hashmap som gir Data, Sky, IoT og AI/ML løsninger og konsulentkompetanse på tvers av bransjer med en gruppe innovative teknologer og domeneeksperter som akselererer forretningsmessige resultater av høy verdi for våre kunder. Vær sikker Og kontakt Med John På LinkedIn og nå ut for flere perspektiver og innsikt i å akselerere dine datadrevne forretningsresultater.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.