본문 바로가기

카테고리 없음

CERN, 기계 학습 대회 개최 - 누구나 LHC의 실험 데이터의 AI 모델 만들기에 도전 할 수있다?

 

출처 : https://jp.techcrunch.com/2018/05/05/2018-05-04-particle-physics-gets-the-machine-learning-treatment-as-collider-data-multiplies/

 

 

유럽 입자 물리 연구소의 LHC [ 대형 강 입자 충돌기 ]에서 얻어진 자료는 놀라운 양이다. 과학자들은 실험에서 새로운 지식을 얻기 위해이 데이터를 처리해야한다. 게다가 LHC의 최근 업그레이드를 통해 데이터 량은 한 자리수 이상 증가 할 전망이다. 이 데이터의 분류에 대해 CERN에서는 기계 학습을 이용하여 데이터를 처리하고 AI 모델 소립자 물리학의 다음 돌파구를 얻을 도움이하려고하고있다.

사방 27 킬로미터의眞空터널 내에 설치된 거대한 검출기가 광속 근처까지 가속 된 고 에너지 양성자의 충돌에 의해 발생하는 입자의 샤워를 파악한다. 센서는 매우 수명이 짧은 다양한 입자를 감지해야한다. 2013 년부터 2 년에 걸쳐 진행된 개량 공사 에 의해 양자를 안내하는 자기장이 더욱 강화되었다. 새로운 시스템의 조정이 진행되면 기존 10 번 정도의 충돌이 예상 한 곳에서 수백 차례의 충돌이 가능하게된다고한다.

물리학 자에게는 희소식이다. 그러나 더 잦은 충돌이 일어난다는 것은 그만큼 데이터 량도 증가하는 것을 의미한다. LHC의 경우 데이터 10 배 이상이된다. 과학자들은 Nature 기사 에서 "지금까지의 과정에서 처리 속도가 너무 느린 데이터의 분류 정리가 늦어 될 우려가 나오고있다"고 말했다. 현대 데이터 과학자는 거대하고 시끄러운 데이터를 처리하는 경우 AI 기술을 사용한다. CERN의 과학자도이 방법을 택했다.

거절 해 두는하지만 과학적으로 정확한 설명을하지 않는다. 그러나 간단하게 말하면, 기계 학습은 인간이 거대한 데이터에서 뭐든지이든 의미있는 연관성을 찾으려하는 프로세스의 전산화이다. 제약 에도 천문학 에서도 인간의 심리 조작 (Facebook이 그럴듯한)하지만 지저분한 데이터를 앞두고 "왕겨와 종류를 가리는 '필요가있을 때 매우 효과적인 수단을 제공하고있다. 소립자 물리학도 새로운 응용의 예이다.

새로운 분야를 시작 때 건전한 경쟁이 도움이된다. 그래서 CERN은 TrackML는 조금 수수한 대회를 개최하고있다. 물리학 및 데이터 과학자는 기가 바이트 규모의 LHC의 실험 데이터를 다운로드하고 정확하게 분류하는 모델 만들기를 할 수있다. 우리도 알린 것처럼, CERN에서 300TB의 실험 데이터를 공개 하고 있지만, 대회에서 더 저렴한 크기의 데이터 세트가 사용된다.

상금도 작은 것으로, 2 만 5000 달러에 불과하다. CERN의 자금은 새로운 슈퍼 전자기 개발 소진했을지도 모른다.

그러나 콘텐스토에는 입장료 같은 것은 없다. 관심이있는 벗기고는 Kaggle의 TrackML 대회 페이지 를 열고 데이터를 다운로드 할 수있다. 결과의 제출까지 충분히 시간이있다. 마감은 8 월 13 일이다. 제출 된 성과는 모두 오픈 소스되므로, CERN이 알고리즘을 검거 한밑천을 노리는 것이 아닌가 등과 걱정할 필요는 없다.

저작자표시 비영리 (새창열림)