구글은 최근 보안 정책 업데이트를 통해 사용자가 인터넷에 올리는 모든 데이터를 자사의 인공지능 모델 훈련에 사용할 권리가 있다고 선언했다. 이번 업데이트는 구글이 얼마나 AI 도구 개발에 집중하고 있는지 보여준다.
논란의 보안 업데이트
구글은 업데이트에서 “구글은 자사의 서비스를 개선하고 사용자와 대중에게 혜택을 제공하는 신규 제품, 기능 및 기술을 개발하기 위해 정보를 사용한다. 예를 들어, 당사는 공개적으로 접근할 수 있는 정보를 활용해 구글의 AI 모델 훈련에 사용하고 구글 번역, 바드, 클라우드AI 등의 제품과 기능을 개발하는 데 활용한다.”
구글 대변인 크리스타 멀둔(Christa Muldoon)에 따르면 “그동안 구글의 보안 정책은 인터넷에서 접근할 수 있는 공개적 정보를 활용해 구글 번역과 같은 서비스를 위한 언어 모델 훈련에 사용한다는 사실을 투명하게 공개했다.”
그녀는 더버지(The Verge)에 설명하며 “가장 최근의 업데이트는 단순히 바드와 같은 신규 서비스가 포함된다는 것을 명확히 한다. 당사는 인공지능 기술 개발에 AI 원칙과 함께 보안 규칙 및 안정 장치를 적용하고 있다”라고 말했다.
흥미롭게도 수정되기 이전의 기존 정책에서는 구글이 임의의 공개 정보를 활용해 “언어” 모델 훈련 및 기능 개발에 활용할 수 있다고 언급했다. 정책 문구를 수정함으로써 구글은 사용자들에게 그들이 인터넷에 올리는 모든 내용이 바드와 그 후속작 및 회사가 개발하는 다른 모든 생성형 인공지능 제품을 훈련시키는 데 사용될 수 있다고 고지한 것이다.
즉 구글의 검색 엔진, 지메일, 유튜브 등 모든 구글 제품에 사용자들이 올리는 컨텐츠는 저장되고 기업에 의해 사용된다는 의미가 된다. 더구나, 구글은 공개적으로 접근한 데이터로 인공지능을 훈련한다고 밝혔는데, 결국 인터넷에 올라온 거의 모든 컨텐츠를 사용하겠다는 의미로도 해석할 수 있다.
구글의 혁신적 검색 엔진이 페이지랭크와 전체 웹을 효율적으로 분류하는 능력을 바탕으로 개발되었다는 점을 고려할 때, 구글의 인공지능 계획은 상당히 중요한 의미를 가진다.
개인 정보 보호는 오랫동안 인터넷 플랫폼의 문제였다. 하지만 생성형 인공지능이 출현하며 사안은 단순히 회사에서 개인 정보에 접근하는지에서 개인 정보를 어떻게 활용하는지로 변화했다.
예측한 바와 같이, 이번 업데이트는 인터넷 사용자로부터 상당히 큰 비판을 받았다. 대부분의 사용자는 회사가 개인 정보 보호법을 지켜야 한다고 호소했으며 다른 이들은 구글의 브라우저, 이메일, 번역기에 대한 대체재를 추천하고 있다.
Over the long weekend, Google updated its privacy policy to collect public data for AI training.
The data will train Google's AI models and build products/features such as Google Translate, Bard, and Cloud AI capabilities.
Key points:
-Google can use any information people post… pic.twitter.com/JOhmA5rBHY— Rowan Cheung (@rowancheung) July 4, 2023
데이터 프라이버시 vs 인공지능 발전
구글 업데이트 전에 챗GPT 제작사 오픈AI는 인터넷으로 사용자의 개인 정보를 무단으로 수집했다는 혐의로 집단 소송을 당했다. 고소인들은 오픈AI가 수백 만 개의 소셜 미디어 댓글, 블로그 게시글, 위키피디아 글, 가족 레시피 등을 사용자의 허가 없이 수집하여 챗GPT 훈련에 사용했다고 주장했다.
구글이 사용자의 데이터에 접근할 수 있는 능력을 고려하면, 비슷한 소송이 잇따를 것으로 보인다.
일반 대중 외에도 정부 기관, 회사, 조직에서도 인공지능 모델을 훈련하기 위한 데이터가 어떻게 수집되는지에 관심 갖기 시작했다. 가령, 유럽 연합은 ‘인공지능법(AI Act)’에서 회사가 인공지능 시스템을 훈련하는 데 사용되는 데이터가 유관 정보 보호 법을 따른다는 것을 보장할 의무가 존재한다고 명시했다.
일론 머스크 역시 웹 정보 수집으로 데이터를 수집하는 것에 관해 우려를 표현하였다. 그는 트위터에 발생한 여러 사태가 사용자가 웹사이트에서 데이터를 수집하는 것을 예방하는 차원에서 발생했다고 이야기했다.
또한 데이터 스크래핑 및 시스템 조작 등 정보 수집을 방지하기 위해 트위터는 사용자가 하루에 볼 수 있는 트윗 메시지의 수를 제한했다. 불행히도, 이러한 조치는 플랫폼을 사용 불가능하게 만들어 비현실적인 방법이 되었다.
구글은 기술 산업의 여러 분야에서 우위를 점하고 있는 만큼 새로운 정책을 우회해 데이터가 사용되는 것을 막을 방법이 많지 않다. 하지만 구글이 접근해도 좋은 정보만 올린다거나 다른 대체 서비스를 활용한다면 회사가 접근할 수 있는 사용자 정보의 양을 상당히 줄일 수 있을 것이다.
관련 기사:
- 그래프 코인 17% 상승 이유∙∙∙같은 AI 암호화폐인 y프리딕트도 펌핑?
- 2023년 AI 관련주 총정리 – 관련 암호화폐 종목 순위 TOP12
- 계속 상승하는 페페2.0, 그 이유는? ‘이 밈코인’이 PEPE2.0를 따라잡을 수 있을까?
월 스트리트 밈즈 (WSM) - 최신 밈 코인
- 팔로워가 백만 명이 넘는 커뮤니티 보유
- NFT 프로젝트 숙련자들이 창립한 프로젝트
- 사전판매 현재 절찬리 진행 중 - wallstmemes.com
- 사전판매 런칭 당일에만 30만 달러 이상 모금한 인기 프로젝트