소송과 저작권 협상 현황 

1. 소송 현황

- 뉴욕타임스(NYT)는 작년 1227일에 마이크로소프트(MS)와 오픈AI(GPT의 개발사)를 상대로 뉴스저작권 침해 소송을 제기. NYT는 소송에서 오픈AI가 뉴욕타임스 기사를 무단으로 복사해 대규모 언어 모델(LLM)을 학습시켰다고 주장.

- AI 훈련에 미디어 콘텐츠의 중요성이 높아지면서 미디어와 테크 업계의 갈등이 확산되는 분위기. 이번 소송에서 특히 주목할 점은 언론사가 챗GPT AI 시스템을 뉴스 비즈니스의 잠재적 경쟁자로 간주하고 있다는 것. NYT는 소장에서 피고(오픈AIMS)들은 NYT의 저널리즘에 대한 막대한 투자에 무임승차하려 한다, NYT의 콘텐츠를 대가 없이 사용해 NYT를 대체하는 제품을 만들고 NYT의 고객을 빼앗아갔다고 지적.

- 예를 들어 오픈AI의 챗봇이 시사 문제나 뉴스적 가치가 있는 주제에 대한 질문을 받으면 NYT 기사에 기반한 답변을 생성할 수 있으니까, 독자들이 이제 굳이 NYT 웹사이트 방문의 필요성이 줄어들 가능성이 있음. 그리고 그것은 당연히 NYT 웹사이트의 트래픽 감소로 이어짐. 결국에는 광고 및 구독 수익이 감소하게 될 것임.

2. 저작권 협상 현황

- 블룸버그에 따르면 오픈AICNN과 폭스그룹, 타임 등 언론사들과 콘텐츠 라이선스 협상을 진행하고 있는 것으로 알려짐. 오픈AI는 작년 7월에 미국 AP통신, 12월에는 독일 악셀스프링거와 계약. 파이낸셜 타임스(FT)에 따르면 오픈AI는 악셀스프링거에 과거 기사와 앞으로 생성되는 기사를 받는 조건으로 연간 수천만 유로(1천만 유료 = 146)를 지불할 예정이라고.

- 뉴욕타임스는 구글과는 개별 협상에 성공했지만, 오픈AI와는 수개월에 걸친 논의에도 뉴스저작물 사용료 계약을 체결하는 데 실패.

뉴욕타임스(NYT)의 소송문 관련

1. ‘환각(Hallucination)’ 취약성으로 브랜드 가치 훼손

- 환각 현상이 발현으로 인한 뉴욕타임스의 평판 훼손을 소송문에 담은 것. 뉴욕타임스 기사에 포함돼 있지 않은 내용은 뉴욕타임스의 원문으로 거론해 뉴욕타임스 상표의 품질과 신뢰를 훼손했다는 것. 허위조작정보의 확산 가능성을 크게 높이는 부작용과 악용가능성 있음.


2. ‘와이어커터(Wirecutter)’의 수익모델에 피해

- 와이어커터의 핵심 수익모델은 제휴 마케팅. 특정 상품군을 치밀하게 조사하여 비교평가한 뒤에 고객들에게 제품별 장단점을 제시. 그리고 그 제품을 클릭하고 구매하고 발생한 수익을 수수료 형태로 받는 구조. 뉴욕타임스 전체 매출에서 와이어커터 매출의 비중이 10% 수준. 뉴욕타임스 광고 수익이 19.5%인 것을 감안하면 엄청나게 큰 규모. GPT와 빙챗의 생성결과물이 와이어커터의 제품 추천사항 상당 부분을 그대로 표시하면서 그 결과물에 와이어커터의 링크가 포함되어 있지 않음. 와이어커터 수익모델에 심각한 피해를 준다는 것.


3. LLM의 취약점인 역류문제

- LLM은 대량의 데이터를 학습하는 과정에서 몇 가지 요인에 의해 학습 데이터를 암기해서 그대로 역류해 내는 경우가 발생. 모델의 규모가 커질수록, 데이터 중복성이 많을수록 암기를 통한 역류 현상이 발생한다고 함.

- 뉴욕타임스의 저작물을 허락 없이, 약관을 위배해 학습 데이터로 활용한 점 그리고 GPT의 생성물이 뉴욕타임스 저작물의 상당 부분을 표절했다는 사실을 입증. 이를 위해 저작물성이 높은 뉴욕타임스의 대표적 퓰리처상 수상작을 표절의 샘플로 했다고 함.

- 예를 들어 유료 구독을 해야 볼 수 있는 NYT의 유료 콘텐츠를 챗GPT의 챗봇을 통해 그대로 볼 수 있음. 이는 NYT의 구독, 광고 등의 기반을 흔드는 문제로 발전할 우려가 있음.


4. 오픈AI의 입장

- ‘오픈AI와 저널리즘이라는 제목의 성명을 통해 고소 이유가 불명확하고 제출된 근거도 설득력 없다고 반박. 오픈AI“NYT의 소송은 무의미하다고 생각한다면서도 NYT와 건설적인 파트너십을 희망하고 있으며 NYT의 오랜 역사를 존중한다고 마무리.

▣ Current status of litigation and copyright negotiations

1. the status of litigation

- The New York Times filed a lawsuit against Microsoft and OpenAI (the developer of ChatGPT) on Dec. 27 last year. In the lawsuit, the New York Times claimed that OpenAI learned a large-scale language model by copying articles of The New York Times without permission.

- Conflicts between media and tech industries are growing as media content is becoming more important in AI training. What is particularly noteworthy in the lawsuit is that media companies regard AI systems such as ChatGPT as potential competitors in the news business. "The defendants (OpenAI and MS) are trying to get free rides on the NYT's huge investment in journalism, using NYT's contents at no cost to make products that replace the NYT and deprive NYT of customers," the New York Times noted in its complaint.

- For example, if an open AI chatbot is asked about current events or topics of news value, it can generate answers based on NYT articles, which is likely to reduce the need for readers to visit the NYT website. And, of course, it leads to less traffic on the NYT website. Eventually, advertising and subscription revenues will decline.

2. Current status of copyright negotiations

- According to Bloomberg, OpenAI is reportedly negotiating with CNN, Fox Group and Time to license its contents. OpenAI signed contracts with AP in July last year and Axel Springer in Germany in December. According to the Financial Times, OpenAI will pay Axel Springer tens of millions of euros per year (10 million U.S. dollars = 14.6 billion dollars) in exchange for receiving past and future articles.

- The New York Times succeeded in individual negotiations with Google, but failed to sign a fee contract for news works after months of discussions with OpenAI.

▣ regarding the New York Times' lawsuit

1. 'Hallucination' vulnerability damages brand value

- The lawsuit contained in the lawsuit the damage to the New York Times' reputation caused by hallucinations. The article said that the newspaper damaged the quality and credibility of the New York Times trademark by citing content that is not included in the New York Times article as the original text of the Times. There are side effects and possibilities of abuse that greatly increase the possibility of spreading false manipulated information.

2. Damage to 'Wirecutter's profit model

- Alliance marketing is a key profit model for wire cutters. After carefully examining and comparing a specific product line, they present the strengths and weaknesses of each product to customers. And a structure in which the product is clicked, purchased, and the revenue generated is received in the form of a commission. Wirecutter sales account for 10% of the New York Times' total sales. Given that the New York Times' advertising revenue is 19.5%, it is tremendously large. The results of ChatGPT and BingChat indicate a significant portion of the wirecutter's product recommendations, but the results do not include the wirecutter's link. It causes serious damage to the wirecutter's profit model.

3. A 'reflux' problem that is a vulnerability in LLM

- In the process of learning a large amount of data, LLM memorizes the learning data due to several factors and refluxes it as it is. It is said that the larger the size of the model and the more data redundancy, the more reflux phenomenon occurs through memorization.

- It proved that the works of the New York Times were used as learning data without permission, in violation of the terms and conditions, and that the products of the GPT plagiarized a significant portion of the works of the New York Times. To this end, the New York Times' representative Pulitzer Prize-winning work with high copyrightability was used as a sample of plagiarism.

- For example, you can watch paid contents of NYT that can only be viewed by paying subscribers through ChatGPT's chatbot. There is a concern that this may develop into a problem that shakes the foundation of NYT's subscriptions and advertisements.

4. OpenAI's position

- In a statement titled "OpenAI and Journalism," OpenAI said, "The reasons for the complaint are unclear, and the grounds for the submission are not convincing." OpenAI concluded, "We believe that the NYT's lawsuit is meaningless, but we hope for a constructive partnership with the NYT and respect its long history."


