야후, 13테라 데이터 공개

야후가 1월14일 머신러닝 연구자를 위한 예제 데이터를 무료로 공개했다. 데이터 크기는 13테라바이트(TB)다.

야후는 공식 블로그에 “데이터는 머신러닝 연구에 꼭 필요하지만 그동안 규모가 있는 회사만 대용량 데이터를 얻을 수 있었다”라며 “더 많은 연구단체들이 대규모 데이터 기반 머신러닝을 연구할 수 있도록 이번 데이터를 공개했다”라고 설명했다.

이번 예제 데이터는 야후의 2천만 사용자가 2015년 2월부터 5월까지 야후 뉴스피드에 보낸 정보다. 사용자 정보는 익명 처리했다. 여기에는 야후 뉴스, 야후 스포츠, 야후 파이넨스, 야후 무비, 야후 이스테이트 관련 데이터들이 포함돼 있다.

출처 – 블로터 | 야후, 연구자를 위한 머신러닝 데이터 공개

야후코리아가 철수하고 야후 관련 서비스는 우리와 접점이 많지 않죠. 야후날씨 앱을 사용하고 있긴 하지만 깔끔한 디자인 외에는 별다른 차별점이 없습니다.
메리사 메이어가 CEO 로 취임한 뒤 야후가 살아났다며 떠들던 언론은 이제 그녀의 리더십 부재를 말하며 비판하고 있죠. (관련기사)
이번 데이터 공개가 어떤 반응을 이끌어낼지는 모르지만, 네이버도 그렇듯 요즘 포털들이 데이터를 많이 개방하고 있네요. 유행인가.
Share:
domingo

domingo

글쓰는 감성개발자 도밍고입니다. IT, 책, 축구, 커뮤니티 등에 관심이 많습니다. 가장 핫한 트랜드를 간단히 요약하고 코멘트를 달아 여러분들께 드리고자 합니다. 여러분들의 인사이트를 위하여!

  • bottleisland

    블로터 쪽으로 링크가 끊어져있네요! 본문의 영어 원문 기사에만 링크가 걸려있습니다!

    • Domingo Oh

      감사합니다! 제가 실수를 했네요.
      다시 링크 걸어두었습니다 ^^