생성형 AI 기술이 촉발한 데이터 대혁명과 사회 대전환, 그 저변에 우리 연구자가 피와 땀으로 쌓아 올린 학술 데이터가 있습니다. 국가의 막대한 연구개발(R&D) 예산과 연구자의 열정과 노력으로 생산된 공공의 지식 자산이 이제 AI 산업의 가장 중요한 원자재가 되었습니다.
그러나 우리는 이 전환 과정에서 정작 지식 생산의 주체인 연구자와 학술 공동체가 철저히 소외되고 있음을 목도합니다. 우리의 지식은 동의나 정당한 절차 없이 상업적 이익을 위한 도구로 전락하고 있으며, 이는 학문의 공공성과 연구자의 존엄성을 모두 심각하게 훼손합니다. 지식공유연대는 이를 더 이상 좌시할 수 없어 다음과 같이 우리의 입장과 요구를 밝힙니다.
1. 현실 진단: 데이터 착취, 인식 부재, 그리고 실존적 위협
2025년 대한민국의 학술 데이터 활용 현실은 지식의 제대로 된 확산이 아니라 약탈과 독점에 가깝습니다. 상용 학술 DB 플랫폼 대부분은 연구자로부터 저작권 이용 허락 없이 AI 상품을 개발 및 판매하고 있으며, 거대 기술 기업은 공공 데이터를 선점하여 막대한 이윤을 창출하고 있습니다. 이대로라면 한국의 역사와 사회문화에 대한 AI의 시각과 분석 능력 그리고 그 힘이 소수 기업에 종속되어, 우리의 지식이 왜곡되거나 편향된 채 미래 세대에게 전달될 위험이 커집니다.
이뿐만 아니라 학술 공동체 내부의 심각한 저작권 인식 부재도 문제를 악화시키고 있습니다. 국내 대다수 학술 단체가 발행 학술지에 대한 저작물 이용 허락 범위 표시(CC 라이선스) 정책 필요성을 모르거나 가벼이 여겨왔기 때문에, AI 시대 증폭된 학술 저작권 침해 가능성과 그 위험을 제대로 인지하지 못하는 상황입니다.
이처럼 저작권 인식이 부재한 상황에서, AI 검색이 학술 정보 탐색의 새로운 표준이 되는 시대가 도래했습니다. 이는 위기이자 기회입니다. AI가 양질의 학술 데이터를 학습할 때, 연구자와 학술 공동체는 다음과 같은 혜택을 얻을 수 있습니다: AI를 통한 지식의 확산으로 연구 영향력이 증대되고, AI가 생성하는 새로운 연구 통찰과 도구를 활용할 수 있으며, 데이터 제공에 대한 정당한 보상을 통해 지속가능한 연구 생태계를 구축할 수 있습니다. 그러나 현재는 이러한 상호 이익이 실현되지 않고 있습니다. 우리의 저작권 인식 부재로 인해 AI 기업들은 학술 데이터를 무단으로 활용하면서도 그 혜택을 독점하고 있습니다. 더욱이 ChatGPT 같은 AI가 접근할 수 없는 폐쇄적 학술 정보는 지식 생태계에서 소외될 위험에 직면해 있습니다.
이러한 복잡한 상황은 우리에게 중요한 질문을 던집니다. 어떻게 하면 연구자의 권리를 보호하면서도 지식의 공공성을 실현할 수 있을까요? 오픈액세스가 자칫 연구자의 지적 재산권을 무력화시키는 도구가 되어서는 안 됩니다. 동시에 폐쇄적 시스템이 학문의 고립을 초래해서도 안 됩니다. 우리가 추구해야 할 것은 ‘권리가 보장되는 개방’입니다. 연구자가 자신의 데이터에 대한 통제권을 유지하면서도, 지식이 사회에 기여할 수 있는 새로운 패러다임이 필요합니다. 이는 AI 기업과의 일방적 관계가 아닌, 상호 책임과 이익이 공유되는 파트너십을 통해서만 가능합니다.
이를 위해 우리는 다음과 같은 원칙을 천명합니다.
2. 원칙 선언: 우리의 학술 데이터 주권을 천명합니다.
우리는 학술 연구의 미래를 위해 흔들릴 수 없는 다음의 원칙을 선언합니다.
- 데이터 주권은 연구자와 학술 공동체에 있다: 모든 학술 데이터의 주권은 그것을 생산한 연구자와 이를 뒷받침하는 학술 공동체에 있고, 모든 권리는 연구자로부터 나옵니다. 오픈액세스는 지식의 자유로운 공유를 위한 연구자의 주체적 선택이지, 권리의 포기가 아닙니다.
- 학습 데이터 고지권과 활용 승인권은 불가침의 권리이다: 모든 연구자는 자신의 연구 성과에 대한 AI 학습 활용 현황을 고지받을 권리(고지권)와 사전에 이를 승인하거나 거부할 권리(승인권)를 가집니다. 어떤 명목으로도 연구자 동의 없는 데이터 수집과 비공개 학습은 용납되지 않습니다.
- AI의 이익은 공공에 환원되어야 한다: 공공의 자산인 학술 데이터를 통해 창출된 AI 기술의 혜택과 상업적 이익은 반드시 공공의 발전과 학문 후속세대를 위해 환원 및 재투자되어야 합니다. 이는 연구자의 저작권과 데이터 주권을 침해하지 않는 방식으로 이루어져야 하며, 오히려 연구자가 자신의 권리를 유지하면서도 사회에 기여할 수 있는 지속가능한 모델을 추구합니다.
3. 구체적 요구: 지금 당장 행동에 나설 것을 강력히 촉구합니다.
하나. 정부와 국회를 향하여: 오픈액세스(OA) 생태계 강화와 제도적 기반 구축을 요구합니다.
- 국내 OA 전환 예산 확보: 해외 출판 논문 지원에 치중된 정책을 전면 재검토하고, 연간 1,000억 원 규모의 예산으로 국내 OA 논문 출판 비용을 지원하여 국내 학술지가 실질적으로 OA로 전환할 수 있는 생태계를 구축해야 합니다.
- ‘학술데이터공공활용위원회(가칭)’ 설립: AI 학습 데이터 활용에 대한 사회적 합의를 담은 법적 근거를 마련하고 이를 관리 감독할 독립 기구 설립을 포함하여 데이터 활용의 공공성 확보를 위한 법제화가 필요합니다.
- ‘국가연구개발혁신법’ 개정안의 조속한 통과 및 독소조항 제거: 국가 R&D 결과물의 공공적 활용을 위해 오픈액세스(OA)를 의무화하는 법안을 즉각 통과시키십시오. 단, 현재 법안의 ‘저장소 기탁’ 조항이 상용 DB 플랫폼의 합법적 데이터 착취 수단으로 악용될 소지가 다분합니다. 이를 방지하기 위해, 연구 결과물은 반드시 정부 또는 공공기관이 직접 운영하고 관리하는 공공 리포지터리에 기탁하도록 명시하는 법률 조항을 넣어 공공의 자산이 사유화되는 것을 원천적으로 차단해야 합니다.
둘. AI 기업과 상용DB사를 향하여: 학술 데이터 공정 이용과 사회적 책임을 요구합니다.
- 학술 데이터 ‘선 허락, 후 이용’ 원칙 의무화: 네이버, 카카오, 누리미디어 등 AI 기업과 상용 DB사는 저작권 이용 허락 범위(CC 라이선스 등)가 명시되지 않은 학술 데이터를 이용하고자 할 경우, ‘공정 이용’을 자의적으로 주장하며 무단으로 사용해서는 안 됩니다. 반드시 사전에 해당 학술단체로부터 명시적인 이용 허락을 받거나 정당한 데이터 이용 계약을 체결해야 합니다.
- ‘학술 데이터 이용 투명성’ 요구: AI 기업과 상용DB사는 어떤 학술 데이터를 어떤 AI 모델 학습에 사용했는지, 이를 통해 발생한 수익은얼마인지 주기적으로 학술 공동체에 투명하게 보고할 의무를 이행하십시오.
- ‘학술 공공 데이터 펀드’ 조성 사회적 협약 제안: 학술 데이터를 활용해 얻은 수익의 일정 부분을 ‘학술 공공 데이터 펀드’에 출연하여 국내 OA 및 학문 후속세대 지원에 재투자하는 사회적 협약을 체결할 것을 강력히 제안합니다.
셋. 학술 공동체 내부를 향하여: 지속가능한 미래를 위한 변화를 제안합니다.
- ‘연구자 저작권 보유’를 중심으로 계약 관행의 개선을 논의합시다. AI 시대를 맞아 기존의 저작권 이양 중심의 계약 관행은 재검토가 필요합니다. 연구자의 데이터 주권을 존중하는 차원에서, 저작권은 연구자가 보유하고 학술단체는 이용 허락을 받는 방식으로의 점진적 전환을 함께 논의해 나가기를 희망합니다.
- AI 학습 데이터 활용에 대한 연구자의 선택권 보장을 제안합니다. 연구자가 자신의 저작물이 AI 학습에 활용되는지 명확히 인지하고 스스로 결정할 수 있도록, 이용 허락 계약서에 관련 선택 조항을 마련하는 것이 바람직합니다. 또한 동의 시에도 활용 범위와 조건을 구체적으로 정할 수 있도록 표준 계약서 개정을 함께 고민해볼 시점입니다.
- 연구자의 권리가 보장되는 오픈액세스(OA)로의 전환을 함께 모색합시다. 연구자의 데이터 주권과 지식의 공공성을 조화롭게 실현하는 효과적인 모델은 ‘권리 보장형 오픈액세스’입니다. 각 학술단체의 특성에 맞는 지속가능한 OA 전환 모델을 발굴하고 확산하기 위한 공동의 노력이 필요합니다.
- 건강한 학술 데이터 생태계를 위한 논의에 동참해 주십시오. 이 모든 제안은 학술 공동체 구성원들의 폭넓은 공감대와 참여 속에서 실현될 수 있습니다. ‘연구자 데이터 주권 선언’ 캠페인은 우리의 권리를 주장하는 것을 넘어, 더 건강한 학술 생태계를 만들기 위한 열린 대화의 장입니다. 많은 분들의 관심과 참여를 부탁드립니다.
4. 우리의 제언: 데이터 주권 수호를 위한 실천 과제
우리는 선언에만 머무르지 않고, 연구자 데이터 주권이 실질적으로 보장되는 사회를 만들기 위해 다음과 같은 실천적 대안을 제안합니다.
- (가칭) ‘학술 데이터 공익 법률 지원단’ 구성 및 법적 대응 체계 마련이 시급합니다. 부당한 데이터 이용과 불공정 계약 관행에 대응하기 위해 법조계와 학술 공동체가 협력하는 지원단이 필요하며, 시장지배력 남용에 대한 공정거래위원회 제소 등 적극적인 권리 구제 활동이 이루어져야 합니다.
- 신뢰할 수 있는 학술 플랫폼을 위한 ‘(가칭) 연구자 주권 인증’ 제도의 도입을 제안합니다. 연구자의 데이터 주권을 존중하고 AI 수익을 공정하게 배분하는 학술지와 플랫폼을 인증하는 제도를 통해, 연구자들이 신뢰하고 논문을 투고할 수 있는 기준이 제시되어야 합니다.
- 데이터 이용 투명성을 높이기 위한 ‘(가칭) AI 학습 데이터 감시 시스템’ 운영이 필요합니다. 연구자 동의 원칙을 위반하거나 불투명하게 데이터를 활용하는 기업 정보를 공개하여, 학술 공동체가 경각심을 갖고 대응할 수 있는 사회적 감시 체계가 구축되어야 합니다.
- 연구자의 권리를 보호하는 기술적 표준과 가이드라인이 개발되어야 합니다. 학술 데이터에 AI 학습 활용 여부를 명시하는 디지털 워터마킹이나 메타데이터 표준을 마련·공유하여, 기술적 차원에서도 연구자의 의사가 존중받는 기반을 구축해야 합니다.
5. 미래 비전과 연대 호소: 공공의 지성으로 AI의 미래를 열자
이 문제는 특정 분야의 이해관계를 넘어, 대한민국 학문 전체의 미래와 학문 후속세대의 연구 자율성이 걸린 중차대한 사안입니다. 이에 우리는 학계, 법조계, 기술 전문가, 시민사회, 언론 및 대중을 아우르는 ‘범사회적 학술 데이터 공공성 협의체’ 구성을 제안합니다. 또한 국경을 넘어 국제 오픈액세스 단체들과 연대하여 이 문제에 공동으로 대응해 나갈 것을 권고합니다.
2025년 11월 21일
지식공유연대
댓글
타인을 비방하거나 혐오가 담긴 글은 예고 없이 삭제합니다.