언론인 연구모임

[요기저기]AI 활용한 기사 작성 실무- 안혜민 SBS 기자

작성일 25.12.18

본문

언론인 연구모임 '요기저기(요즘 기자들의 저널리즘 기록)'에서는 지난 11월 25일 안혜민 SBS 기자를 초청해 AI를 활용한 기사 작성에 대한 강의를 들었습니다.

모임에서 제공한 강의 개요를 공유합니다.


인공지능(AI) 활용한 기사 작성 실무 - 안혜민 SBS 기자


이번 모임에는 인공지능(AI)의 역사와 개념, 국내외 데이터 저널리즘 활용 사례, 알고리즘의 위험성과 윤리, 기자가 현업에서 AI 도구를 어떻게 활용할 수 있는지까지 폭넓게 다뤘다. 최근 다시 쟁점이 되는 생성형 AI는 새로 등장한 혁신적 발명품으로 여겨지지만, 1950년대부터 이어져 온 기계학습·딥러닝 연구의 연속선 위에 있으며, 저널리즘에서는 기자 개인이 윤리적 기준을 세운 후 통제·해석 가능한 도구로 선별적으로 써야 한다는 게 핵심 내용이다.


1. AI의 역사와 기본 개념

- 1956년 다트머스 회의에서 ‘AI’라는 용어가 처음 등장했고, 이후 퍼셉트론, 1980년대 다층 퍼셉트론과 역전파, 1990년대 LeNet-5 등으로 이어지며 신경망·딥러닝 연구가 발전해 왔다.

- 2012년 알렉스넷이 이미지넷 대회에서 압도적인 성능을 보이며 GPU·딥러닝이 본격적인 주류가 되었고, 이후 대형 모델(LLM)과 멀티모달 모델이 현재의 생성형 AI 붐을 만들었다고 할 수 있다.


2. 지도·비지도·강화 학습과 저널리즘 활용

- 기계학습은 정답이 있는 데이터를 이용하는 지도 학습, 라벨 없이 유사성을 찾는 비지도 학습, 보상으로 행동을 조정하는 강화 학습으로 크게 나뉜다.

- 지도 학습은 이미지 분류·회귀 예측, 비지도 학습은 댓글·텍스트 클러스터링, 강화 학습은 목표를 향한 반복적 시도와 보상 설계에 주로 쓰이며, 저널리즘에서는 주로 지도 학습(분류·예측)을 활용한 탐사보도가 많은 편이다.


3. 국외 데이터 저널리즘 사례(‘랜덤포레스트’ 방법 중심)  

- 스위스 공영방송 SRF의 ‘Fake Follower’ 프로젝트는 기자들이 직접 라벨링한 SNS 팔로워 데이터를 랜덤포레스트로 학습해 인플루언서들의 가짜 팔로워 비율을 추정하고, 데이터·코드·모델 성능을 모두 공개해 재현 가능성을 확보해 의미있는 연구다.

- 버즈피드의 ‘Hidden Spy Planes’, 프로퍼블리카의 에볼라 취약지역 예측 기사도 모두 라벨이 있는 사례들을 학습한 뒤, 전수 데이터에 랜덤포레스트를 적용해 의심되는 항공기·고위험 지역을 찾아낸 대표적 탐사보도 사례다.


4. 알고리즘의 위험·편향·윤리

- 시카고 트리뷴은 재산세 평가 알고리즘이 고가 주택은 실제 가치보다 낮게, 저가 주택은 높게 평가해 구조적으로 불공정한 세금을 부과한다는 점을 데이터 분석으로 밝혀낸 바 있다.

- 프로퍼블리카의 COMPAS 재범 위험도 분석, 블룸버그의 GPT 채용 실험 사례는 학습 데이터 속 인종 편견이 알고리즘에 그대로 반영돼 흑인에게 불리한 점수를 주는 등 ‘기계적 차별’을 만들 수 있음을 보여주는 사례다.


5. 생성형 AI의 한계와 해석 가능성 문제 ​

- 딥러닝·LLM은 수억·수조 개의 매개변수 때문에 내부 연산을 사람이 이해·설명하기 어려워, 왜 이런 답을 냈는지 설명할 수 있는 랜덤포레스트·의사결정나무와 큰 차이를 보인다.

- 앤트로픽 등에서 내부 활성 패턴을 시각화하는 등 해석 가능성을 연구하고 있지만, 모델이 ‘사후 설명’을 그럴듯하게 꾸며 말하는 문제와 결합하면 저널리즘에 그대로 의존하기는 아직 위험하다고 지적한다.


6. 언론사·기자의 실제 AI 도구 활용 사례

- SBS는 사내 AI 통합 플랫폼을 만들어 아카이브 영상에서 얼굴·대사 검색, 유튜브 뉴스 분석, 유사 기사 검색 등 기능을 제공한다. 타 방송사에는 CCTV 이벤트 자동 탐지 기능도 있는 것으로 알려졌다.

- 발제·연구·스크립트 초안·그래프 코드·섬네일 카피 등 거의 전 과정에서 GPT·클로드·제미나이, 이머시브 트랜슬레이트, 노트북 LM, 미드저니, ElevenLabs 등 여러 도구를 ‘보조 작업자’처럼 활용해 소규모 인력으로 주간 영상물을 제작할 수 있다.


7. AI 윤리·가이드라인과 기자의 태도

- SBS는 생성 영상 재현 금지, 고지 의무, 단계별 위험 구분 등 사내 AI 활용 가이드라인을 정했고, 한국일보·MBC 등도 CMS·사업화·윤리 규범에서 선도 사례로 언급됐다.

- AI를 무조건 두려워하기보다, 편향·오류 가능성을 전제하고 스스로 윤리 기준과 활용 원칙을 세운 뒤 적극적으로 써 보면서 ‘이 도구가 어디까지 쓸 만한지, 어디서부터 위험한지’를 체감해 보는 것이 중요하다는 결론이 나왔다.


2d72be5f40858cdac51bb57d0282fda0_1766022161_6224.jpg
<요기저기 회원들이 안혜민 SBS 기자의 강의를 듣고 있다.> 


주무관청 : 공공누리