AI 리서치하면서 알게 된 사실들
최근 AI 관련해서 자료를 허겁지겁 긁어모으듯 소화하면서 알게 된 사실. 정보의 회전과 변화가 너무 빠른 업계라 그런지 정보 소스의 특징이 좀 특이한 거 같다. (리서치 시작한지 얼마 안 돼서 잘 모를 수도 있는데 그렇다면 알려주시라)
- 오랜 시간을 들여 검증받는 논문의 가치가 여기서는 생각보다 그리 크지 않다고 했다. 정보 회전이 빨라서 금방 옛날 정보가 되기 때문.
- 그래서 검증을 거치지 않고 바로바로 올라오는 논문이나 블로그, 트위터에 유의미한 최신 정보가 많은데 당연히 이러면 필터링 능력이 중요해진다(그리고 나에겐 필터링 안목이 없다......)
- 그래도 인용 횟수는 유의미한듯. 그리고 논문들의 인용 횟수와 인용 관계를 알려주는 사이트가 있는 것을 보고 놀라고 말아따.
- 특정 한 키워드나 분야에 대한 그간의 연구를 싹 훑고 싶다면 '서베이' 논문에서 체리피킹하면 된다는 팁을 얻어따. ㅎㅅㅎ
- 블로그를 무시하기에는 재야 고수들이 너무 많았다. 개발자들은 도대체 어떤 사람인가.- 그래도 내가 논문을 보고 싶었던 건 'Attention is all you need'처럼 AI 역사에 굵직한 족적을 남긴 자료들을 확보하고 싶었기 때문. 그리고 이런 논문들을 찾아내는 건 어렵지 않았다.(어디선가는 반드시 논문 제목을 언급하고 있기 때문에) 대부분의 경우 원문 PDF까지 별 허들 없이 받을 수 있어서 수집쟁이는 너무나 신이 났다. 오픈소스 만세.
- 딥러닝에 대한 설명은 남세동 대표님이 안될과학 나와서 설명한 게 최고로 단순 명쾌한듯. (+궤도의 비유)
- 어쩌다 스캐터랩 대표님이 네이버 데뷰 나와서 이루다 개발기를 설명한 영상을 봤는데 이런 정보가 공개되어 있었다는 점에 깜놀. AICC 리서치를 할 때 AICC 솔루션의 자세한 기술적 정보를 그렇게 찾아 헤맸는데(뜬구름잡는 자료 말고) 데뷰에 클로바 케어콜의 꽤 자세한(그래서 너무 어려운) 기술적 설명 영상도 있었다는 것에 깜놀. 이 귀한 영상들의 조회수가 1000 안팎이라는 사실에 또 깜놀.
- 개발자들의 글에서 종종 '잘 쓰고 싶은 욕심'이 느껴졌는데, 사실 뭔가를 '만드는' 사람들의 욕구는 다 비슷한 결일 거라고 생각한다.
- 자료는 미친듯이 많은데 못 알아듣는 말이 반이라서 눈 앞에 떡을 두고 못 먹는 느낌 ㅎㅎㅎㅎㅎㅎ
마지막으로 이건 딴소리인데, 앞으로의 글쓰기 방식은 완전히 달라지겠구나 하는 생각을 새삼 했다. 각명문자에서 표면문자로, 표면문자에서 컴퓨터 타이핑으로, 그리고 프롬프트로 변하는 텍스트 입력의 방식...
글쓰기는 점점 더 빠르고 가벼운 작업이 되어가고 있구나. 그게 좋든 나쁘든.