Intelligence in Space

Kaggle manual

2019-03-19
이연승
Tutorials

본 포스트에서는 Kaggle 페이지 설명에 대한 번역을 살펴보겠습니다.


Kaggle

당신은 데이터를 Kaggle을 이용해 데이터 과학자들과 쉽게 연결될 수 있습니다. 과학자들이 백만 개 이상의 자료를 가지고 있는 Kaggle이 당신을 위해 무엇을 할 수 있는지 보십시오. Kaggle은 데이터 과학 대회 플랫폼입니다. Kaggle은 당신이 어려운 문제를 해결하고, 당신의 맞춤형 팀을 모집하고, 당신의 데이터 과학 재능의 힘을 증폭시키도록 도와줍니다.

당신 그룹 내의 대회를 개최하고 싶다면 Kaggle InClass에 방문해주세요.

비즈니스

사업

세계에서 가장 큰 데이터 과학자 커뮤니티에서 가장 어려운 비즈니스 문제에 대해 상담하십시오. 더 알아보기

어떻게 세계적인 알고리즘을 당신의 사업으로 변형시킬 것인가?

Kaggle에서 찾아보세요. Kaggle이 감독하는 머신러닝 대회는 당신의 데이터에 맞는 가장 정확한 알고리즘을 선정하기 때문에 당신은 확신을 가지고 결정할 수 있습니다.

어떻게 작동하는가

  • 정의: 당신이 소지한 가치가 있는 머신러닝 문제를 확인하세요. 사업정의
  • 범위: Kaggle과 협력하여 문제 명세서를 다듬고 데이터 세트를 확정합니다. 사업범위
  • 생성: 당신의 대회 페이지를 생성할 때 Kaggle과 협력하세요. 사업생성
  • 시작: 포럼에 참가하고, 공유 코드를 검토하고, 리더보드에서 모델이 향상되는 것을 지켜보세요. 사업시작
  • 학습: 대회 수상자에게서 코드와 문서를 받고, 지식 전달 전화에 따라 후속 조치를 취합니다. 사업학습

모집

모집

맞춤형 경쟁과 후보 코드, 협업 및 성과에 대한 가시성을 통해 팀의 최고의 적임자를 찾으십시오.

더 알아보기

새로운 사람을 모집할 방법을 찾고 있습니까?

Kaggle에서 고용해보세요.

우리의 채용 대회는 후보자들에게 당신의 사업 요구에 맞춘 문제들을 해결하라고 요구하기 때문에, 그들은 당신이 원하는 인력일 것입니다.

어떻게 작동하는가

  • 정의: 조직의 데이터 과학 작업을 나타내는 사용 사례를 선택한다. 모집정의
  • 범위: Kaggle과 협력하여 문제 명세서를 다듬고 데이터 세트를 확정합니다. 모집범위
  • 생성: 당신의 대회 페이지를 생성할 때 취업 기회도 포함하여, Kaggle과 협력하세요. 모집생성
  • 시작: 포럼에 참여하고, 공유 코드를 검토하고, 당신의 회사 문화의 예를 보여주세요. 모집시작
  • 고용: 참가자들이 제출한 스크린 이력서와 맞춤형 후보 보고서를 사용하여 채용을 시작합니다. 모집고용

연구

연구

사회적 이익을 위한 당신의 머신러닝 연구 문제를 Kaggle에서 해결하십시오.

지원하기

연구 대회

배경

Kaggle에서 행해진 최고의 작품들 중 일부분은 연구 대회에서 나왔습니다. 이들은 커뮤니티에 새롭고 독특한 기계학습 데이터 셋과 사용 사례를 제시하며, Kaggle은 이를 Kaggle 사용자들이 더 정기적으로 이용할 수 있도록 하고 싶습니다.

역사적으로 연구 대회를 가능케 하는 과정은 네트워크와 최고 수준의 환경이었습니다. 앞으로, Kaggle은 의욕적인 연구, 학술, 비영리 단체들이 Kaggle에서 오픈 소스 대회를 주최하는 것을 더 쉽게 만들고 싶습니다.

기회

Kaggle은 단체와 제휴해 연간 최대 5회의 무료 연구 대회를 개최합니다. Kaggle은 관심 있는 단체들에게 Kaggle의 고려 사항에 대한 간단한 제안서를 제출할 것을 요청하고 있습니다.

요구사항

연구 대회를 개최할 자격을 얻으려면 개최 기관은 다음과 같이 해야 합니다.

  • 학문적, 연구적 또는 비영리조직이 되어야 합니다.
  • 공개적으로 경쟁 데이터 셋을 공개할 수 있는 법적 승인을 받아야 합니다.
  • 상금을 게시해야 합니다.
  • 오픈 소싱 되는 해결책 획득을 조건으로 상품을 증정합니다.

선발기준

Kaggle은 1년 내내 연구 주최자를 순환적으로 선정할 것입니다. Kaggle은 그들의 지원서 양식의 내용을 바탕으로 하여 장래의 대회를 개최할 호스트를 뽑을 것입니다. 기본적으로 Kaggle은 다음과 같은 것들을 볼 것입니다.

  • 적합성 - 프로젝트가 명확하게 설계되어있는 문제인가, 성공적인 대회를 뒷받침할 수 있는 충분한 자료가 있는가.
  • 타당성 - 대회에 데이터를 이용할 수 있게 하는 것이 논리적으로 가능한가, 개최 기관은 성공적인 대회를 촉진할 수 있는 위치에 있는가.
  • 영향력 - 이 대회가 다루는 문제의 범위는 무엇인가, 오픈소스 해결책은 이 경쟁이 지원하는 산업에 얼마나 큰 영향을 미칠까?

Kaggle과 예비 호스트는 대회를 개최하고 시작하기 전에 심사 과정을 거치게 될 것입니다. 이 조사 과정에는 데이터 셋의 검토, 문제의 사전 모델링 및 평가 지표 선택이 포함될 것입니다. 또한, 주최기관은 데이터 사용계약을 체결하고 대회 시작할 때 모든 상금을 Kaggle에게 전달할 준비가 되어있어야 합니다. Kaggle은 대회가 끝난 후 수상자들에게 경품 지급을 촉진할 것입니다.

Kaggle 인클래스 머신러닝은 대회를 즐겁게 해줍니다.

Kaggle의 무료 셀프서비스 플랫폼을 사용하여 여러분의 학생들을 참여시키고 영감을 주는 교실 대회를 만드세요.

인클래스작동방법

어떻게 작동하는가

첫 번째 대회를 설정하는 방법과 플랫폼을 가장 잘 활용하는 방법에 대해 알아보려면 여기를 클릭하십시오.

인클래스질문사항

FAQs

Kaggle은 다른 InClass 호스트들의 피드백과 지식을 편집하여 당신이 또다시 그것을 생각하지 않아도 됩니다.

인클래스주제

주제

우리의 무료 데이터 과학 워크벤치는 모든 InClass 대회에서 활성화됩니다. R과 Python으로 코드를 쓰고 공유합니다.

간단하게 당신의 첫 번째 Inclass 대회를 생성할 수 있습니다.

Kaggle의 셀프서비스 플랫폼을 사용하여 학생들을 위한 재미있고 매력적인 기계 학습 대회를 만드는 방법을 배우세요

  • 정의: 머신러닝 문제와 당신의 학생들이 학습하기 위해 사용하는 분류된 데이터 셋 모델을 식별합니다. 인클래스정의
  • 생성: 셀프서비스 마법사를 사용하여 데이터를 업로드하고, 평가 metric을 선택하고, 문제 진술을 조작하십시오. 인클래스생성
  • 초대: 학생들과 공유할 공개 초대 링크를 만드십시오. 인클래스초대
  • 시작: 일단 당신의 대회를 테스트하면, 당신은 시작할 수 있습니다. 당신의 학생들은 제출을 시작할 수 있고 라이브 리더보드에서 그들의 점수를 볼 수 있습니다. 인클래스시작

설정 가이드

InClass 설정 가이드

대회 만들기

Competition wizard는 당신이 대회를 개최할 곳입니다. wizard는 당신에게 다른 콘텐츠 페이지, 타임라인, 평가 척도, 데이터 셋을 포함한 당신의 대회의 설정 과정을 안내할 것입니다. 대회의 제목과 부제를 입력하여 시작하십시오. ‘Create Competition’을 클릭하면 Host 탭으로 이동합니다.

데이터 셋 찾기

대회를 만들기 위해서는 먼저 깔끔한 데이터 셋이 필요합니다. Kaggle은 머신러닝에 친숙한 데이터 셋을 이곳에 정리했습니다. 당신은 또한 Kaggle의 데이터 셋 플랫폼을 탐색하여 특정 주제에 대한 데이터를 찾을 수 있습니다. 검색 박스를 사용하여 특정 주제에 대해 태그가 지정된 데이터를 찾을 수 있습니다. tag:’[topic]‘을 입력하세요

![데이터셋검색](/images/ysl/kaggle_datasetsearch.png)

스코어링 설정

당신은 몇 가지들이 필요합니다.

  • 솔루션 파일
  • 샘플 제출 파일

각각의 대회에서 당신은 솔루션 파일과 샘플 제출 파일을 csv 형식으로 업로드할 준비를 해야 할 것입니다. 모든 솔루션과 제출 파일은 고유한 Id Column를 가지고 있어야 합니다. Id Column은 점수 체계가 어느 행의 제출 파일이 어느 행의 솔루션 파일에 대응하는지 아는 유일한 방법입니다.

깔끔한 데이터 셋

모든 Inclass 대회는 public과 private 리더보드를 가지고 있습니다. 이 두 개의 리더보드 간에 데이터를 수동으로 분리하려면, 당신은 당신의 데이터 셋에 ‘Uage’ column을 추가하여야 합니다. Usage column은 데이터 셋의 마지막 column이어야 하며 Public 또는 Private의 두 가지 값 중 하나를 가져야 합니다. 당신이 만약에 Usage column을 제공하지 않으면 행은 빈칸에 자동으로 샘플을 넣을 것입니다. Public 행은 대회가 진행되는 동안에 실시간 리더보드를 생성합니다. Private 행은 최종 순위를 결정하기 위해 사용되며, 대회가 끝날 때까지 오직 당신만이 볼 수 있습니다.

데이터셋

여기서는 위의 데이터 셋에서 Prediction1과 Prediction2를 모두 예상 Column에 매핑하고, 두 칼럼 모두 점수 매김에서 균일하게 계수 한다.(그것들이 하나의 큰 column인 것처럼)

솔루션 파일

일부 metrics에서는 여러 개의 열을 동시에 기록할 수 있습니다. 이를 위해 솔루션 파일의 각 열을 메트릭의 동일한 열에 매핑합니다.(대부분의 지표에서 그 column의 이름은 “expected”입니다.) 이러한 경우에는 솔루션 파일은 다음과 같습니다.

데이터셋

일부 metrics는 직사각형 CSV 형식에 맞지 않도록 가변적인 수의 예측을 허용한다. 이러한 대부분의 metrics들은 공간적으로 범위가 정해진 목록을 수용하기 위해 작성되었습니다. 아래의 표가 그 예입니다. 매트릭스

샘플 제출 파일

제출 파일에는 채점에 관련되지 않는 정보가 포함되어서는 안 됩니다. 선택한 metric에 따라, 당신은 metric이 기대하는 column에 각 파일의 column이 매핑 되도록 요청받을 것이다. 예제 제출 파일 형식은 다음과 같습니다.

샘플파일

벤치마크 솔루션

학생들이 충족하거나 초과할 수 있는 벤치마크 점수를 작성하려면 벤치마크로 사용하고 싶은 샘플 제출물 옆에 있는 상자를 선택하면 리더보드의 벤치마크로 표시된 점수가 나타납니다.

대회 테스트

일단 당신이 솔루션과 제출 파일을 매핑하면 당신은 제출 샌드박스에서 제출 파일을 시험할 수 있습니다. 이때 채점이 효과가 있는지 확인해야 합니다. 포맷을 작동시키려면 포맷을 몇 번 수정해야 할 수도 있지만, 시스템이 파일에 이상이 있을 경우 명확한 오류 메시지를 제공해야 합니다.

대회테스트

학생 초대

Host > Privacy 탭의 고유한 URL을 공유하여 경쟁사에 학생을 초대할 수 있습니다. 이 URL을 가진 사람은 누구나 대회에 참가할 수 있으므로 그것이 여러분의 그룹 밖으로 유포되지 않도록 하십시오.

학생초대

대회 시작

Host > Launch Checklist로 이동하여 모든 상자가 녹색으로 체크되었는지 확인하십시오. 그 박스들이 녹색이 되면 이제 당신의 대회는 개최될 수 있습니다. 대회가 개최 중이라면 “Competition is active라는 문구가 뜰 것입니다.

대회시작

도움이 필요 하십니까? 기다리지 말고 바로 FAQ에 바로 질문하세요

Kaggle Inclass 대회의 유치와 참가에 관한 교사와 학생들의 가장 일반적인 질문에 대한 답을 찾으세요.

교사

대회 개최

  • 자신이 개최할 대회에 대한 데이터 셋은 어디서 구할 수 있나요?
    • Kaggle의 데이터셋 플랫폼favorite machine learning friendly datasets에서 어느 정도의 간추려진 데이터 셋을 얻을 수 있습니다. 새로운 데이터 셋이 매일 추가되기 때문에 Kaggle은 특정한 주제나 현재의 사건에 대한 데이터를 저 플랫폼에서 찾는 것을 권장합니다. 당신은 특정한 주제와 연관된 데이터를 검색창을 통해서 찾을 수 있습니다.
  • 만약 [an error]이라는 경고 창을 받았다면 어떻게 해결할 수 있나요?
    • 우선 setup quide를 읽어보시길 바랍니다. 그 후에도 그 문제를 해결할 수 없다면, Kaggle forum에서 다른 교사에게 물어보시길 바랍니다.
  • 만약 똑같은 대회를 다시 개최하고 싶다면 처음부터 다시 시작해야 되나요?
    • 지금은 과거에 행해졌던 대회에 대해서 다시 개최할 수는 없습니다. 당신은 설정을 처음부터 다시 시작해야 할 것입니다. 하지만 당신은 이미 모든 테스트와 데이터 정리를 끝낸 상태여서 빠르게 다시 시작할 수 있을 것입니다.
  • 실수로 솔루션 파일을 업로드했는데 어떻게 해야 하나요?
    • Your competition > Host > Evaluation > Hit the Remove button 메뉴로 가세요.
    • 경고 창을 확인하세요.
    • 솔루션 파일 업로드를 클릭한 다음 나머지 평가 단계를 계속하세요. 도구 설명서는 좀 더 자세한 평가 지침이 포함된 페이지에서 사용할 수 있다.
  • Kaggle의 관리자가 대회 개최전에 검토를 할 필요가 있나요?
    • 더이상은 아닙니다. Kaggle InClass는 이제 관리자가 검토할 때까지 기다리지 않고 대회를 설계, 설정 및 시작할 수 있게 해줍니다.
  • 학생들에게 보낼 초대 링크를 어디에서 찾을 수 있습니까?
    • Your competition > Host > Privacy > URL for Sharing 메뉴로 가세요.
  • 지원을 받으려면 어떻게 해야 하나요?
    • Kaggle InClass는 무료이고 셀프서비스 기능입니다. Kaggle은 당신의 대회를 설정하거나 문제를 해결하기 위한 지원을 제공할 수 없습니다. 그러나 플랫폼 전체에 영향을 미치고 있다고 생각되는 문제를 겪고 있다면 Kaggle에 문의하십시오.

대회중

  • 학생이 제출한 파일을 무효화하거나 삭제할 수 있나요?
    • 학생이 제출한 파일은 삭제하거나 무효화 할 수 없습니다.
  • 솔루션 파일을 새로 업로드하고 대회에서 점수를 다시 매길 수 있나요?
    • 솔루션 파일을 새로 올리는 것은 가능하지만, 점수를 다시 매기는 것은 불가능합니다. 새로운 파일을 업로드하시고 지원을 받으시기를 부탁드립니다. 그렇게 하면 관리자가 당신의 대회에 대한 점수를 다시 매길 것입니다. 학생들의 새로운 제출은 새로운 솔루션 파일을 기준으로 점수가 매겨질 것입니다.
  • 참가자들의 이메일 주소를 다운로드해서 새로운 대회를 위해 이메일을 보내고 싶습니다. 어떻게 해야 합니까?
    • 지금은 참가자의 이메일 주소를 다운로드할 수 없습니다.
  • 학생들에게 대회 기간을 더 주고 싶은데, 대회 기한을 어떻게 바꿀 수 있을까요?
    • 만약 대회 기간이 이미 끝났다면 당신은 새로운 대회를 개최하여야 합니다. 만약 대회 기간이 끝나지 않았다면 Your competition > Host > Settings > Deadline 메뉴로 가시면 바꿀 수 있습니다.

학생

등록

  • 대회에 참가하기 위해서는 Kaggle 계정이 필요하나요?
    • 네, InClass 대회에 제출할 Kaggle 계정을 만들어야 합니다.
  • InClass 대회를 위한 다른 새 계정을 생성하였는데 왜 차단당했나요?
    • 대회에서 부정행위를 방지하기 위해서입니다. 오직 하나의 Kaggle 계정만 생성할 수 있습니다. InClass 경쟁에서 학교 이메일 주소를 사용해야 하는 경우에는 My Profile > Edit Profile > Edit 메뉴로 가주세요.
  • 대회에 파일을 제출하려다 차단되었는데 어떻게 해야 하나요?
    • 계정이 차단당하는 가장 일반적인 이유는 다수의 계정을 만들어서입니다. 당신은 단 하나의 Kaggle 계정을 생성할 수 있습니다. 계정을 다시 활성화하려면 지원팀에 연락하여 두 계정과 연결된 이메일 주소와 영구 삭제할 계정을 알려 주십시오.

경쟁

  • 대회 참여를 통해 Kaggle 대회 점수나 메달을 받을 수 있나요?
    • InClass 대회에는 대회 점수나 매달 같은 것은 존재하지 않습니다. 특정한 대회에 참가하거나, kernel을 공유하거나 discussion forum에 참가를 통해서 레벨업을 할 수 있습니다.
  • 만약 제출물에 문제가 있다면 어디서 도움을 받아야 하나요?
    • InClass 문제에 대한 도움을 받는 가장 좋은 방법은 선생님이나 반 친구들에게 연락하는 것입니다. 당신의 설정의 문제와 비슷한 문제를 겪었던 주변 사람들이 당신에게 도움을 줄 것입니다. Kaggle 팀에서는 제출 파일 에러에 대한 지원을 제공할 수 없습니다.

Kaggle 지속하기

  • Inclass 대회가 정말 마음에 드는데, 이후에는 무엇을 해야하나요?
    • Kaggle에는 많은 다양한 종류의 대회들이 있고 그들은 모두 배우기 좋은 기회들입니다. Getting Started competitions는 데이터 과학에 대한 기초지식을 가르쳐줍니다. InClass 대회와 같은 것들은 데이터가 공개되기 때문에 대회 점수를 부여하지는 않습니다. 당신은 몇 가지 튜토리얼에 따라 discussion forum에 참여할 수 있습니다. Playground 대회는 경쟁률이 낮은 형식으로 다양한 유형의 데이터와 머신러닝 기술에 접할 수 있는 또 다른 재미있는 방법입니다.

InClass 만드는 방법

  1. Kaggle 홈페이지 접속 후 로그인을 합니다. Inclass만들기1
  2. 로그인 후 ①메뉴를 클릭 후에 ②메뉴를 클릭합니다. Inclass만들기2
  3. ③메뉴를 클릭하게 되면 가운데 흰 색창이 뜨는데 ④ 파란 글자를 클릭해줍니다. Inclass만들기3
  4. ⑤메뉴를 클릭해줍니다. Inclass만들기4
  5. ⑥, ⑦ 메뉴에 순서대로 제목과 부제목 입력 후 ⑧메뉴를 클릭하여 본인 설정 집단을 생성이 됩니다. Inclass만들기5

Similar Posts

Comments