arXiv에서 컴퓨터 과학 분야의 리뷰 논문 게시를 금지한 배경과 그 파장, 그리고 이에 대한 다양한 연구자들의 반응을 시간 흐름에 따라 상세하게 요약했습니다. 리뷰 논문 및 인용과 관련된 윤리 문제, LLM(대형 언어 모델) 기술 발전 영향, 그리고 앞으로 학계에서 리뷰 논문이 어떤 역할을 해야 할지에 대한 주요 논의를 만날 수 있습니다.
1. arXiv 리뷰 논문 금지 발표와 그 배경
2025년, arXiv는 컴퓨터 과학 분야에서 리뷰 논문(Review Papers)의 업로드를 공식적으로 금지합니다. 이 소식은 연구계에 커다란 반향을 일으키며 온라인상에서도 활발하게 논의가 이루어졌습니다.
가장 먼저 언급된 arXiv 측의 공식적 이유는 "인용이 곧 돈이고, 연구비이며, 상"이라는 점입니다. 즉, 일부 비윤리적인 연구자들이 더 많은 인용을 받기 위해 논문 공장(so-called "paper mills")에서 대량의 리뷰 논문을 '주문'해, 인용을 인위적으로 늘리는 문제가 근본 원인이 되었다는 지적입니다. 이 과정에서 리뷰 논문이 인용수 부풀리기를 위한 "수단"으로 전락한 경우가 많다고 합니다.
"많은 서베이 논문들은 분석이나 종합, 로드맵 제시 없이 그저 주석 달린 참고문헌 목록에 불과합니다. 종종 논문과 아무 관련 없는 논문까지 인용되며, 그런 인용을 '구매할 수 있는 시장'이 있을 것이라고 우리는 의심합니다."
— Thomas Dietterich, arXiv 컴퓨터 과학 섹션 의장
또 다른 중요한 이유는 LLM(대형 언어 모델)의 발전입니다. arXiv 프로그램 디렉터에 따르면, 이런 인공지능 도구로 만들어진 리뷰 논문들은 표절 검사조차 피할 수 있어, 사람이든 소프트웨어든 걸러내기가 점점 어려워지고 있다고 언급합니다.
"LLM 기반으로 작성된 리뷰는 단순한 표절 검사로는 적발이 어렵다."
2. 리뷰 논문 문제점과 저자가 느끼는 추가 문제들
Andrew Akbashev(원글 저자)는 arXiv의 결정에 추가적으로 자신이 느끼는 문제점들도 설명합니다.
- 현재 대부분의 리뷰 논문은 별다른 가치가 없고, 원본 아이디어나 미래 비전 제시도 부족하다는 비판이 있습니다.
- 많은 리뷰들은 단순한 참고문헌 나열(=bibliographic overview)로, 서로 매우 비슷하고, 저품질 연구들을 인용하거나 읽기조차 어렵다는 지적이 나옵니다.
"오늘날 대다수의 리뷰 논문은 쓸모가 없습니다. 비전도 없고, 원본 아이디어도 없습니다."
그리고 현장에서는 저널들이 인용 수와 임팩트 팩터(influence factor)를 높이기 위해 리뷰 논문을 선호하는 구조적 문제가 있다고 지적합니다.
또, LLM이 이미 상당한 수준으로 논문들을 요약하고 적절히 인용까지 집어넣을 수 있기 때문에 굳이 사람이 무가치한 리뷰 논문을 쓸 이유가 없다고 강조합니다.
"LLM은 이미 문헌을 아주 잘 요약합니다. 올바른 인용을 삽입하고, 이해하기 쉬운 언어로 내용을 설명할 수 있습니다. 잘못된 논문, 저품질 연구를 인용하는 인간 리뷰 논문이 무슨 의미가 있나요?"
마지막으로, 리뷰 논문이 너무 많아 아무도 제대로 읽지 않는다는 '리뷰 논문 과잉' 문제도 언급합니다.
리뷰 논문의 존재 목적이 "저자 인용 수와 저널 임팩트 팩터를 올리는 것"으로 왜곡되었다는 비판이 이어집니다.
3. 앞으로 리뷰 논문은 어떤 방향이어야 하나?
이런 문제점들을 바탕으로, 저자는 다음 3가지를 제안합니다.
- 적은 수의 리뷰 논문만 필요하다.
- 매우 높은 품질의 리뷰가 필요하다.
- 단순 요약이 아닌, 대담한 비전을 가진 리뷰가 필요하다.
"우리는 더 적은 리뷰 논문만 필요합니다. 매우 품질 높은 리뷰가 필요하고, 요약에 그치지 않는 대담한 비전을 담아야 합니다."
arXiv의 이런 변화가 앞으로 저널에도 이어질지, 혹은 본인은 너무 순진한 생각을 하는 것일지 의문을 던지며 글을 마무리합니다.
"arXiv가 이 방향으로 움직이기 시작한 건 정말 반갑다. 이제 주요 학술 저널은 어떤 선택을 할까? 내가 너무 순진한 걸까?"
4. 다양한 학계 인사 및 이용자 반응
글 하단에는 여러 연구자와 트위터 이용자들이 다양한 의견을 남겼습니다.
- 어떤 이용자는 좋은 리뷰 논문을 만들려면, 편집장이 잘 알려진 전문가에게 직접 '의뢰하고' 적절한 보수를 지급해야 한다고 강조합니다.
"좋은 리뷰 논문을 쓰는 건 엄청난 일입니다. 실제로 그걸 해낼 만한 사람들은 대부분 시도조차 하지 않죠."
-
반면, Bioinformatics와 같이 자기 분야엔 좋은 리뷰 논문과 다양한 벤치마크가 필요하다며 합리적인 숫자의 리뷰를 요구하는 사람도 있었습니다.
-
"동료들 말고 내 분야 연구는 나만 하니까, 어쩔 수 없이 내가 내 논문을 많이 인용한다. 모든 건 맥락이 중요하다"는 자조 섞인 현실 인식도 등장합니다.
"아무도 그 분야 연구를 하지 않아, 나와 동료끼리만 내 논문 인용합니다... 맥락이 전부입니다."
-
셀프 인용(self-citation)에 대해서도 적절하다면 문제없다는 의견이 있는 반면, 출판이 명성 경쟁(=clout)으로 변질됐다는 쓴소리도 나옵니다.
-
논문의 폭증 현상을 지적하며, arXiv에 리뷰 논문은 물론 일반 논문도 너무 많이 올라오고 있다는 우려도 보입니다.
"누군가 arXiv에 어마어마한 수의 논문을 올리고 있다. (중략) 기존 논문 리뷰조차 누구도 제대로 할 수 없는 시대에 와 있다!"
5. 다양한 논점의 충돌
LLM(인공지능)의 범람으로 저품질, 표절 우려가 큰 리뷰 논문이 더 이상 무차별적으로 용인되어선 안 된다는 강경 입장이 있는 반면, 여전히 분야 전문가가 직접 쓰고, 실제로 기여하는 리뷰 논문은 필요하다는 반론도 이어집니다.
"리뷰 논문은 언제나 그 분야 전문가가 초청받아 써야 합니다."
한편, 리뷰 논문의 가치는 인센티브 시스템(=인용, 임팩트 기반의 평가)이 바뀔 때 자연스럽게 정상화될 거라는 시각도 있었습니다.
마무리
arXiv의 이번 조치는 인용 부풀리기, LLM 도구 남용, 현저한 저품질 리뷰 논문 증가 등 학계의 구조적·기술적 변화를 단적으로 반영합니다. 논쟁의 중심에는 정말로 필요한 리뷰 논문이란 무엇인가에 대한 근본적인 고민이 있습니다. 앞으로 고품질, 창의적인 리뷰 논문만이 살아남는 구조와, 그에 맞는 평가·출판 시스템 개발 논의가 더욱 중요해질 것으로 보입니다. 🚦