본문 바로가기

테크크런치기사

도움 AI 시스템을 만드는 것은 아직 어렵다

추출 : http://jp.techcrunch.com/2018/01/05/2018-01-01-building-ai-systems-that-work-is-still-hard/


[편집부 주] 저자 Martin Welker는 Axonic 의 최고 경영자이다.

TensorFlow 과 OpenAI 같은 AI 프레임 워크의 지원이 있었다고해도 덧붙여 인공 지능은 여전히 많은 Web 개발자들이 필요로하는 것보다 깊은 지식과 이해를 필요로한다. 만약 작동 프로토 타입을 만든 적이 있다면, 당신은 아마 주위에서 가장 똑똑한 인물이다. 축하합니다, 당신은 매우 독점 클럽의 멤버는 것이다.

Kaggle 에 참가하면 실제 프로젝트를 해결하는 것으로, 거기에 상응하는 보수를 얻을조차 수있다. 전체적으로 보면 가치있는 입장이지만, 사업을 시작하는 데 충분 할까? 결국 시장의 구조를 바꿀 수 없다. 비즈니스의 관점에서 보면, AI는 기존의 문제에 대한 또 하나의 구현에 불과하다. 고객이 걱정하는 것은 구현이 아니라 결과 다. 즉, AI를 사용했다고 만사 해결이라고 할 수는없는 것이다. 허니문이 끝나면 실제 가치를 창출해야한다. 장기적으로 보면 중요한 것은 고객 뿐이다.

그리고 고객은 AI에 대해 걱정하지 않을지도 모르지만, VC들은 걱정하고있다. 보도도 그렇다. 그것도 매우. 그 관심의 차이는 시작들에게 위험한 현실 왜곡 공간을 낳을 가능성이있다. 그러나 잘못한다. 보편적 인 다목적 AI를 만든 것이 아니면 젖은 손으로 조라고 할 수는없는 것이다. 비록 당신이 VC 좋아했다하더라도 고객을위한 마지막 1 마일은 제대로 걷고 썬다 필요가있다. 것으로 운전석에 앉아 미래의 시나리오에 대비하기 위해 어떤 준비를 할 수 있는지를 살펴보기로하자.

주류 AI 열차

AI는 블록 체인, IoT 핀 테크 등 다른 주요 트렌드와는 다른 것처럼 보인다. 물론, 그 미래는 매우 예측 불가능하지만 그 것은 어떤 기술도 거의 들어 맞는 것이다. AI가 가지는 차이는 단순히 다양한 비즈니스뿐만 아니라 인간으로서 우리의 가치가 위험에 노출되어있는 것처럼 보인다는 점이다. 의사 결정자이며 창조자이기도 한 우리의 가치가 재고를 강요 당하고있다. 그 것이 감정적 인 반응을 불러 일으키고있다. 우리는 자신을 자리 매김 방법을 모른다.

매우 제한된 수의 기본적인 기술이 그 대부분이 「심층 학습 '이라는 용어의 우산 아래에 분류되는 것이다. 그것은 거의 모든 응용 프로그램의 기초를 형성하고있다. 예를 들어 회선과 리 커런트 뉴럴 네트워크, LSTM 자동 인코더 랜덤 포레스트, 그레디언트 증폭 등이다.

AI는 그 밖에도 많은 접근을 제공하고 있지만, 위에 언급 한 핵심 메커니즘들은 최근 압도적 인 성공을 보여왔다. 대부분의 연구자들은 AI의 발전 (근본적으로 다른 접근 방식에서가 아니라)이 기술을 개선함으로써 이뤄질 것으로 기대하고있다. 그렇다고하는 것으로, 다음이 기술을 '주류 AI 연구 "라고 부르기로하자.

현실적인 솔루션은 모두 이러한 핵심 알고리즘과 데이터를 준비하고 처리하는 비 AI 부분 (예를 들어 데이터 준비, 형상 엔지니어링 월드 모델링 등)과에서 구성되어있다. 일반적으로 AI 부분의 개선에 의해, 비 AI 부분의 필요성이 감소하는 경향이있다. 그것은 AI의 본질에 기인하고 있고, 대부분 그 정의라고 불러도 좋을 것 같아요 - 즉 개별 문제에 대한 대처를 절대적이되어가는 것이다. 그러나이 비 AI 부분 이야말로 종종 AI 기반 기업의 가치 인 것이다. 거기가 비밀 소스 인 셈이다.

AI의 모든 개선이 경쟁 우위를 오픈 소스 형태로 만들어 누구나 사용할 수있는 것으로 해 버릴 가능성이있다. 그 결과는 비참한 것이 될 것이다. Frederick Jelinek 한때 "언어 학자를 해고 할 때마다 음성 인식 장치의 성능이 향상됩니다"라고 말했다.

기계 학습이 가져온 것은 기본적으로 중복 절감 한 것이다. 즉 코드의 데이터화이다. 거의 모든 모델 기반 확률 기반 및 규칙 기반 인식 기술은 2010 년대의 심층 학습 알고리즘 씻겨 버렸다.

도메인 전문 지식, 형상 모델링, 그리고 수십만 줄의 코드가 이제 불과 몇 백 줄의 스크립트 (그리고 충분한 양의 데이터)에 의해 구타 해 버린다. 전술 한 바와 같이, 주류 AI 열차의 경로에있는 독점 코드는 더 이상 방어를위한 자산이되지 않는다는 것을 의미한다.

중요한 기여는 매우 드물다. 진정한 혁신과 새로운 개발뿐만 아니라 기본 구성 요소의 새로운 조합 방법조차 할 수는 매우 제한된 수의 연구들 뿐이다. 이 내부 서클은 당신이 상상하는 것보다 훨씬 작은 것 같은 것이다 (거기에 속하는 100 명 이하의 개발자들이다).

왜 그런가? 아마도 그 이유는 핵심 알고리즘 인 오차 역 전파법 에 뿌리입니다. 거의 모든 신경망이 방법에 의해 훈련되고있다. 가장 간단한 형태의 오차 역 전파법은 대학 1 년의 첫 학기도 공식화 할 수있는 정도의 것이다 - 세련된 거리가 멀다 (라고는 말할 초등학교 수준이라는 것은 없다). 이러한 단순에도 불구하고 (혹은 바로 그 이유로) 그 50 년 이상의 재미 찬란한 역사에서 아주 소량 사람들 만 막을 뒷면을 들여다 그 주요 구조에 대해 질문을 한 것이다.

만약 오차 역 전파법의 의미가 일찍부터 오늘처럼 이해했다면 (계산 능력은 별도로하고) 우리는 현재 이미 10 년 앞을 가던 것이다.

70 년대의 간소 한 초기 신경망에서 리 커런트 네트워크, 그리고 현재 LSTM으로 진행되어왔다 단계는 AI 세계에 일어난 지각 변동이었다. 비록 몇십 줄의 코드 만 필요 없다! 여러 세대에 걸쳐 학생들과 연구자들이 그 수학에 임하고 경사 강하를 계산하고 그 정확성을 입증 해왔다. 그러나 결국 그들의 대부분은 납득하고 "최적화 한 방식이다"라고 작업을 진행 한 것이다. 분석 이해만으로는 부족한 것이다. 차별화 위해서는 "발명자의 직감 '이 필요하다.

연구의 톱에 세우는 것은 극히 드물다이기 때문에 전체 기업의 99.9 %가 앉을 수는 조수석에 불과하다. 핵심 기술은 오픈 소스 툴과 프레임 워크로 업계의 주요 플레이어들에서 볼 수있다. 최신의 수준을 계속 쫓는 위해 자신의 방법은 시간과 함께 소멸 해 간다. 그런 의미에서 AI 기업의 대다수는 이러한 핵심 제품 및 기술의 소비자 인 것이다.

우리는 어디로 가고 있는가?

AI (및 필요한 데이터)는 전기 , 석탄, 금 등의 많은 것과 비교되어왔다. 기술계가 어떻게 패턴이나 경향을 찾아 내자 서두르고 있는지를 알 현상이다. 왜냐하면이 지식이 자신들의 비즈니스를 보호하기 위해 필수적이기 때문이다. 그렇지 않다면, 앞으로의 투자가 하나의 단순한 사실 앞에 낭비되어 버리는 것이다. 그 사실은 만약 주류 AI 열차의 경로에 사업을 쌓아 버리면 미래는 어둡다는 사실이다.

이미 비즈니스를 향해 맹렬히 돌진하고있는 엔진이 가운데에 고려해야 할 중요한 몇 가지 시나리오가 존재하고있다.

제 1 시나리오는 주류 AI 연구 열차는 급속히 감속 또는 이미 중지되었다는 것이다. 이것은 더 이상 접근 할 수있는 문제 클래스가 존재하지 않는 것을 의미한다. 즉, 우리 기차에서 내려 고객을 위해 '라스트 마일'을 걸어야한다는 것을 의미하는 것이다. 이것은 시작들에게 큰 기회가된다. 왜냐하면 지속 가능한 비즈니스를 창출하는 기회를 지닌 독자적인 기술을 구축 할 수있는 기회가 주어지기 때문이다.

제 2의 시나리오는 주류 열차가 현재 속도로 계속 유지하는 것이다. 그 경우에는 피하거나 기차에서 내릴 수도 더욱 어렵게된다. 개별 접근에 대한 도메인 지식은 대기업에 의한 「오픈 소스」에 의해 급속히 위기에 노출된다. 과거의 모든 노력은 가치가 없어 질지도 모르기 때문이다. 현재 AlphaGo 같은 시스템은 오픈 소스 프레임 워크가 제공하는 표준 (바닐라) 기능과는 별도로 매우 높은 비율의 독자 기술이 필요로되고있다. 그러나 조만간 같은 기능을 갖춘 기본적인 스크립트를 보게해도 나는 놀라지 않을 것이다. 그러나 "예측도 할 수없는 미지의 사건"(unknown unknown)는 다음 단계에서 해결 할 수있는 문제 클래스이다. 오토 인코더 및주의 기반 시스템은이를위한 유망한 후보이다.

주류 AI 연구 열차는 급속히 감속 또는 이미 멈췄다.

다음 시나리오는 열차는 더욱 가속화한다는 것이다. 그리고 마침내 " 싱귤러 리티는 곧 '라는 것이다. 그 문제의 책이 여러 권 적혀있다. 그것에 대해 이의를 제기하는 억만 장자들도 있고, 나도 그 건에 관해서는 다른 기사를 쓰는거야. 여기에서 궁극적 인 성과는 범용 인공 지능이다. 만약 이것을 달성 할 수 있으면 모든 베팅은 종료된다.

그리고 마지막으로, 블랙 스완 (예상도 없었던 일이 일어날) 시나리오가있다. 누군가가 차고에서 현재의 주류와는 전혀 닮지 않은 차세대 알고리즘을 발견하는 것이다. 만약이 고독한 라이더가 그것을 자신을 위해 사용할 수 있다면, 우리는 최초의 자력 1 조 달러 장자 (trillionaire)을 목격하게 될 것이다. 그러나 이것은 어디에서 오는 것일까? 나는 이것이 아무것도없는 곳에서 갑자기 나온다고는 생각하지 않는다. 그것은 주류 기술과 버려진 모델 기반의 알고리즘과 결합 될지도 모른다. 2010 년대에는 신경망이 발전하고 연구의 기초의 일부가 손실 된 과거 유망이었다 접근 (기호 접근 등)에도 눈이 향해졌다. 현재 AI에서 이루어지고있는 활동도 다른 관련된 연구 분야를 부활시키고있다. 이제 연구자로 가득 않은 같은 "잘 알려지지 않은 '기법과 알고리즘을 발견하는 것은 점점 어려워지고있다. 그럼에도 불구하고 게임을 바꾸는 방법을 찾아 내고, 부활 시키거나 외부인이 등장 할 가능성은 버릴 수 없다.

승자는 누구?

이상을 정리하고,이 매우 어려운 질문을 할하자. 이에 대한 답은 위의 시나리오뿐만 아니라 당신이 누구인지에 의존한다. 자원과 기존의 자산이 전략의 핵심이기 때문에 비즈니스의 출발점이 방정식에서 중요한 요소이다.

AI 챔피언스 리그에서는 충분한 자금력을 가지고 중요한 재능을 유치 할 수있는 기업의 수는 적다. 이것은 어느 쪽 일까하고 말하면 현재는 비용이 소요되는 과정이기 때문에 수익원은 다른 구해야한다. 이에 따라 플레이어는 잘 알려진 Google, Facebook, Microsoft, IBM들에 한정되는 것이된다. 그들은 현재 오픈 소스 스택과는 다른 거대한 독자적인 시스템 을 구축하고 새로운 클래스의 문제 에 임하고있다. 어느 정도 시간이 경과하면 활력있는 지역 사회를 구축하기 위해, 그들은 이것을 차세대 오픈 소스 프레임 워크에 통합 될 것이다.

이러한 플레이어들은 더 나은 알고리즘을 훈련하기에 적합한 기존의 플랫폼도 소유하고있다. AI는 메가 트렌드 모르지만, 기업을위한 그리고 기업의 일상적인 업무에 적용도 그들의 성공을 위해 중요하다. 이러한 플랫폼 : Amazon, Facebook, Google Apps, Netflix, 심지어 Quora조차도이 AI를 이용하여 핵심 비즈니스 모델을 지키고 강화하고있다. 그들은 AI에 의해 고객에게 더 나은 서비스를 제공하는 방법을 발견하고, 그 한편, 자신의 핵심 사업을 인공 지능을 사용하여 무슨 일을하는지와는 다른 것으로하고있다 (적어도 표면적으로는).

한편, 일부 신흥 플랫폼은 그들 자신의 도구 세트에 AI를 통합하는 방법을 찾아 내고있다. 이러한 기업들은 무엇보다도 AI가 비즈니스를 가능하게 해 준, 그리고 수익 창출을 가능하게 해 주었다고 주장하고있다. 이러한 사업 예 중 하나가 문법 검사기의 Grammarly이다.

언뜻보기에는 기존 업체도 스스로 쉽게 개발할 수있는 멋진 기능처럼 보이는 것이다. 그러나 내용은 더 복잡하다. 그들은 여기에서 2 개의 자산을 구축하고있다. 새로운 품질 향상을위한 커뮤니티 생성 데이터 세트, 그리고 더 지속 가능한 광고 파트너를위한 놀라운 개인화 된 마켓 플레이스이다.

그리고 도구 제조 업체들도있다. Mark Twain이 말한대로 돈을 파고 다른 사람에게 맡기고, 그 옆에 삽을 파는 것이다. 그 방식은 일단 잘했지만, 아마 이번에도 잘 될 것이다. 데이터의 제공, 콘테스트 개최, 인력 교류, 사람들의 교육. 기획을 위해 모든 AI의 지망자가 필요로하는 (또는 희망)을 찾아 내지된다. 그리고 그것으로 벌 것이다.

Udemy는 AI 과정을 가르치고 Kaggle 기업을 지원하고 데이터 과학자들에게 기술을 습득시키기위한, AI 대회를 창시했다. AI의 핵심 역량을 구축 할 필요도없는 기업들은 성공하기 위해 페타 바이트 규모의 데이터를 필요로하고 있기 때문이다. 그리고 그들 대부분은 감독 학습을 채용하고 있기 때문에, 그것을 감독하는 사람도 필요한 것이다.

그리고 AI 컨설팅이라는 틈새 영역을 찾은 기업도있다. 거인 제공하는 오픈 소스 프레임 워크의 어깨조차도 할 일이 아직 많이 남아있다.

Element AI 와 같은 기업은 이러한 추가 AI 관련 일을 할 부품을 제품과 서비스에 통합하는 것을 가능하게했다. 물론, 최근 열린 1 억 200 만 달러의 조달 에 의해 그들은 성공을 위해 필요한 충분한 자금을 얻을 수 있었다.

차례를 기다리는 다른 기업들도있다. 인공 지능 솔루션을 가지고 있으며, 기존의 비즈니스 프로세스를 대체하려고하고있는 기업들이다. 그러나 이러한 기업들은 두 가지 점에서 도전에 직면하고있다. 하나는 같은 문제를 해결하기위한 오픈 소스 프로젝트를 개발하는 것이 가능하다, 그리고 다른 하나는 기존의 벤더가 같은 문제를 해결하기 위해 더 자동화 된 솔루션에 대해 상당한 투자를하고있는 것이다.

업계에서 가장 중요한 요소는 거의 연구자 그룹에서 일어나고있는 주류 AI 연구의 속도이다. 그들의 연구 성과는 거의 지연없이 AI 챔피언 플레이어들에 의해 개발 된 프레임 워크에 포함된다. 기타 많은 우리는 인공 지능 열차 승객하거나 혹은 그 경로에있는 장애물이다. 결국 , 위치 가 모두이다. 자신의 위치를 위의 문맥을 고려하여 결정하는 기업은 바라는 목적지에 도착할 수있을 것이다 .