버전 관리 데이터 과학 솔루션

#1 진화하는 데이터 과학 시리즈

존 아벤

팔로우

2020 년 1 월 7 일·3 분 읽기

나는 학문적 배경에서 온,그래서 나는 버전 관리가 데이터 과학 내에서 수행되는 방법에 대해 이야기 할 때,나는 경험에서 이야기. 그러나 내 경력을 통해 소프트웨어 엔지니어,건축가 및 기술 혁신 리더로서의 기술을 연마했습니다. 이 날 어떻게 것 들 및 수행 되었습니다 뿐만 아니라 어떻게 그들이 할 수 있는 더 나은,훨씬 더에 대 한 독특한 관점을 제공 합니다.

데이터 과학은 학계로부터 버전 관리를 계승했습니다. 그리고 이러한 접근 방식은 대부분의 계산 과학 분야가 수년 동안 해왔 던 것입니다. 오해하지 마세요,컴퓨터 과학은 초기 디지털 시대에 이런 식으로 갔다(많은 경우에,이 학계에서 여전히 유행이다),하지만 고급 관행에 이동했습니다.

가짜 버전 관리 방지

이 방법은 무엇입니까? 그것은’스마트’파일 이름을 통해’버전’체계를 만드는 방법입니다. 이 스키마는 일반적으로 다음과 같은 종류의 파일을 생성합니다.

  • , …
  • _1, _2, _1_1

제가 가짜 버전 관리라고 부르는 버전 관리에 대한 접근 방식은 질병이며 풍토병입니다. 그러나 이러한 관행에서 벗어나는 것은 수행 될 수 있으며 모델 관리와 같은 현대적인 관행이 요구해야합니다. 이 버전 제어 시스템을 사용하여 수행 할 수 있습니다(벤처 캐피탈)—힘내 기반 솔루션에 대한 업계 선호.데이터 과학 개발 수명 주기에서 기계 학습 모델의 버전 및 기타 아티팩트를 불변으로 추적할 수 있습니다. 그러나 다른 소프트웨어 엔지니어링 분야와 달리 코드 버전 관리는 필요하지만 충분하지는 않습니다.

추가 문제를 고려해야 합니다.:

  • 데이터 버전 관리
  • 모델 버전 관리
  • 모델링 메타데이터 저장

이러한 추가 문제를 관리 할 수 있지만,바닐라 구현은 장기적으로 충분하지 않으며 도움보다 더 많은 해를 입힐 수 있습니다. 해시맵은 이 경로를 따라갈 수 있도록 도와주고 고유한 비즈니스 요구에 가장 잘 맞는 솔루션을 마련할 수 있습니다.

이것은 진화하는 데이터 과학 시리즈의 일부입니다.

다른 채널에서 자유롭게 공유 할 수 있으며 여기에서 해시맵의 모든 새로운 콘텐츠를 확인하십시오. 모든 것을 데이터 엔지니어링 및 클라우드에 대한 캐주얼 대화에서 듣고,스포티 파이,애플,구글 및 기타 인기있는 스트리밍 애플 리케이션에뿐만 아니라 탭에 해시 맵의 팟 캐스트 해시 맵을 확인하십시오.

이 글을 읽으셨다면,존의 다른 최근 이야기 중 일부는 다음과 같습니다:

존 아벤 박사는 해시맵의 엔지니어링 디렉터로 데이터,클라우드,사물인터넷 및 인공지능 솔루션 및 컨설팅 전문 지식을 산업 전반에 걸쳐 제공하고 있으며,혁신적인 기술자와 도메인 전문가들로 구성된 그룹이 고객을 위해 고부가가치 비즈니스 성과를 가속화하고 있습니다. 반드시 링크드 인에 존과 연결하고 데이터 중심의 비즈니스 성과를 가속화에 더 많은 관점과 통찰력을 위해 밖으로 도달.

답글 남기기

이메일 주소는 공개되지 않습니다.