"공짜 정보 안돼" 챗GPT 차단 사이트 급증...주요 100개 사이트 중 15% 달해
"공짜 정보 안돼" 챗GPT 차단 사이트 급증...주요 100개 사이트 중 15% 달해
  • 최석진 기자
  • 승인 2023.08.28 05:42
  • 수정 2023.08.28 05:42
  • 댓글 0
이 기사를 공유합니다

1천개 사이트 중 GPT봇 차단 사이트 비율 추세 [오리지널리티.AI 홈페이지 캡처]
1천개 사이트 중 GPT봇 차단 사이트 비율 추세 [오리지널리티.AI 홈페이지 캡처]

생성형 인공지능(AI)을 둘러싼 저작권 논란이 제기되면서 챗GPT의 정보 수집을 차단하는 사이트가 증가하고 있다.

27일(현지시간) AI 콘텐츠 정보 제공업체인 오리지널리티.AI(originality.ai), 연합뉴스 등에 따르면 따르면 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1천개 가운데 챗GPT의 정보 수집 툴인 GPT봇(GPTBot)을 차단한 사이트는 9.2%에 달했다.

GPT봇은 챗GPT 개발사 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 크롤러로, 지난 7일 공개됐다.

오픈AI는 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다.

GPT봇 공개 후 첫 주인 지난 15일에는 GPT봇 차단율이 5%에 미치지 않았으나, 2주 차에는 10%까지 육박했다.

특히, 인기 있는 주요 사이트 100개로 범위를 좁히면 차단율은 15%에 달해 이용자 수가 많은 사이트일수록 차단율이 높은 것으로 조사됐다.

주요 사이트 중에는 로이터 통신(Reuters.com), 아마존(Amazon.com), 뉴욕타임스(NYTimes.com), CNN방송(CNN.com) 등 주요 기사 사이트가 대거 포함됐다.

로이터 통신의 경우 주요 GPT봇 공개 다음 날인 8일 웹 크롤링을 차단해 주요 100개 사이트 중에는 가장 먼저 정보 수집을 막았다.

구글의 경우 지난 5월 NYT와 뉴스콘텐츠 사용료로 3년에 걸쳐 1억 달러(1천327억원) 지급하기로 하는 합의한 것으로 알려졌다.

오리지널리티.AI는 "GPT봇 접근을 막는 사이트가 일주일에 5% 포인트가량 늘어나는 등 GPT봇 차단 사이트는 꾸준히 늘어나는 것으로 조사됐다"고 설명했다

dtpchoi@wikileaks-kr.org


  • 서울특별시 마포구 마포대로 127, 1001호 (공덕동, 풍림빌딩)
  • 대표전화 : 02-702-2677
  • 팩스 : 02-702-1677
  • 청소년보호책임자 : 소정원
  • 법인명 : 위키리크스한국 주식회사
  • 제호 : 위키리크스한국
  • 등록번호 : 서울 아 04701
  • 등록일 : 2013-07-18
  • 발행일 : 2013-07-18
  • 발행인 : 박정규
  • 편집인 : 박찬흥
  • 위키리크스한국은 자체 기사윤리 심의 전문위원제를 운영합니다.
  • 기사윤리 심의 : 박지훈 변호사
  • 위키리크스한국 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 위키리크스한국. All rights reserved.
  • [위키리크스한국 보도원칙] 본 매체는 독자와 취재원 등 뉴스 이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알립니다.
    고충처리 : 02-702-2677 | 메일 : laputa813@wikileaks-kr.org
ND소프트