주메뉴 바로가기 본문 바로가기

왜 AI는 '외로움'을 찾지 못하는가 - AI 시대를 위한 데이터 설계 방법론 - 1편

  • AI
  • 인공지능
  • 온톨로지

AI 시대를 위한 데이터 설계 방법론 - 1편

왜 AI는 '외로움'을 찾지 못하는가

안녕하세요, 모두를 위한 스마트워크 신용우입니다.


이번에 'AI 시대를 위한 데이터 설계 방법론'이라는 새로운 주제로 연재를 시작합니다. 이 시리즈를 통해 AI 시대에 데이터를 어떻게 설계해야 하는지, 특별히 온톨로지 모델을 복지 현장의 언어로 풀어보고자 합니다.

이 시리즈는 여섯 가지 질문을 따라갑니다. ①왜 관계인가 ②체계를 어떻게 설계하는가 ③데이터를 어떻게 채우는가 ④기준을 어떻게 세우는가 ⑤안전한가 ⑥지금 무엇을 할 수 있는가.

오늘은 첫 번째 이야기입니다.


한 가지 질문


우리 기관에 등록된 300명 가운데, 가장 외로운 분은 누구일까요? 이번 겨울 가장 걱정되는 분은 누구일까요?


이 질문을 사례회의에서 꺼냈다고 합시다. 근거 자료는 명확하지는 않습니다. 하지만 10년 넘게 같은 지역에서 사람을 만나온 팀장은, 대충 누구일지 감이 옵니다. 1103동 어르신이 석 달째 이웃 모임에 나오지 않고 있다는 것. 봉사활동을 많이 하시는 동네 미용실 원장님이 요즘 그분 통 안 보인다고 했다는 것. 작년까지 매주 안부를 확인하던 통장님이 이사를 가서 더는 안부를 묻지 못한다는 것.


10년 넘게 쌓인 실천지혜입니다. 그런데 그 실천지혜는 그분의 머릿속에 있습니다. 상담 일지에도 기록이 되어 있지만, 한눈에 볼 수 있는 형태로는 존재하지 않습니다. 그분이 기관을 떠나면, 그 실천지혜도 함께 흐려집니다.


AI에게 물어보겠습니다


요즘 사회복지 현장에도 AI 바람이 불고 있습니다. ChatGPT에 상담 일지를 붙여넣으면 깔끔하게 요약해줍니다. 법령을 물어보면 찾아줍니다. 보고서 초안도 만들어줍니다. 정말 편합니다.


그러면 이 고민을 AI에게 물어보겠습니다.

"우리 기관 300명의 상담 기록을 분석, 고립 위험이 가장 높은 분 다섯 명은 누구일까요?"

AI는 명확하게 답하지 못합니다.


왜일까요. 300명의 관계를 AI가 해석할 수 있도록 준 적이 없기 때문입니다.


AI가 읽는 것은 텍스트입니다. 상담 일지를 요약할 수는 있습니다. 하지만 300명의 관계를 한꺼번에 비교하는 것은 다른 차원의 문제입니다. "1103동 어르신의 이웃 모임 참석이 끊겼다"는 정보는 일지 텍스트 어딘가에 있을 뿐, 검색하거나 비교할 수 있는 구조로는 존재하지 않습니다.


편리해진 것은 문서 처리입니다. 관계의 발견이 아닙니다.


관계가 구조화된다는 것


생태도를 잘 알고 계시죠? 당사자를 가운데 놓고, 가족, 이웃, 기관 등 다양한 관계를 그린 뒤, 그 사이를 선으로 잇는 그림입니다. 관계의 강도에 따라 선의 굵기가 달라지고, 갈등이 있으면 톱니 모양을 넣기도 합니다. 이 그림 하나에 당사자의 세계가 담깁니다.


만약 이 생태도가 종이 위의 그림이 아니라, 살아있는 데이터가 된다면 어떨까요.


세상에 어떤 종류의 것들이 있고, 그것들이 어떻게 연결되는지를 정리한 설계도 — 이것을 온톨로지(Ontology)라고 부릅니다. 온톨로지는 그리스어 온토스(ontos, 존재하는 것)로고스(logos, 탐구)가 합쳐진 말입니다. 말 그대로 '존재하는 것들에 대한 탐구'입니다.


이 탐구의 역사는 깊습니다. 기원전 5세기, 파르메니데스가 처음으로 "존재란 무엇인가?"를 철학의 중심에 놓았습니다. 그 이전의 철학자들은 "세상은 무엇으로 이루어져 있는가" — 물인가, 불인가, 공기인가 — 를 물었습니다. 파르메니데스는 그보다 근본적인 질문을 던졌습니다. "있다는 것은 무엇인가." 서양 형이상학의 출발점입니다.


한 세기 뒤 아리스토텔레스가 이 질문을 이어받아 체계화합니다. 그는 '존재하는 것으로서의 존재(being qua being)'를 탐구하는 학문을 '제1철학'이라 불렀고, 세상의 모든 것을 열 가지 범주로 분류했습니다. 실체(substance), 양(quantity), 질(quality), 관계(relation), 장소(place), 시간(time) 등이고, 주목할 것은 네 번째 범주입니다. 아리스토텔레스는 2,400년 전에 이미, 존재를 이해하려면 관계를 반드시 봐야 한다고 말한 것입니다.


이 탐구에 '온톨로지'라는 이름이 붙은 것은 훨씬 뒤의 일입니다. 1606년, 독일의 학자 야콥 로르하르트(Jacob Lorhard)가 'ontologia'라는 라틴어 합성어를 처음 만들었고, 18세기 크리스티안 볼프(Christian Wolff)가 이 용어를 학술적으로 정착시켰습니다. 그리고 20세기 후반, 컴퓨터 과학이 이 오래된 개념을 빌려옵니다. 1993년 톰 그루버(Tom Gruber)는 온톨로지를 '공유된 개념화에 대한 명시적 명세'라고 정의했습니다. 사람들이 합의한 분류 체계를, 기계도 읽을 수 있는 형태로 만든다는 뜻입니다.


파르메니데스의 질문에서 그루버의 정의까지, 2,500년 동안 핵심은 변하지 않았습니다. 무엇이 있고, 그것들이 어떻게 연결되어 있는지를 정리하는 것입니다.


사회복지도 처음부터 같은 질문을 해왔습니다. 토인비홀의 인보관 운동, 제인 애덤스의 '환경 속의 인간', 메리 리치먼드의 「사회진단」, 그리고 한국 현장의 "어울려 살게 돕는 것", "인간부터 사회까지의 생태체계를 담당하는 것" — 모두 사람을 떼어내서 보지 않고, 관계 속에서 이해하고 실천하려는 시도였습니다.


이 실천지혜는 현장에 충분히 있습니다. 부족한 것은 실천지혜가 아닙니다. 이 실천지혜를 데이터로 옮기는 방법입니다. 그 방법이 온톨로지입니다.


종이 위의 생태도, 데이터 위의 생태도


'OO마을 온톨로지를 구축한다'고 하면 무슨 뜻일까요. OO마을에 무엇이 있는지 — 당사자, 이웃, 상점, 기관, 서비스 — 를 분류하고, 그것들이 어떤 관계로 연결되는지 — 안부를 확인한다, 단골이다, 서비스를 이용한다 — 를 정의하는 것입니다.


생태도를 떠올려 보면 됩니다. 당사자가 점이 되고, 이웃과 상점과 기관이 점이 되고, 그 사이의 관계가 선이 됩니다. 엑셀이 숫자를 담는 도구라면, 온톨로지는 관계를 담는 도구입니다. 차이는 하나입니다. 종이 위의 생태도는 사람만 읽을 수 있지만, 온톨로지로 구조화된 생태도는 AI도 읽을 수 있습니다. AI가 이 지도를 따라가며 '연결이 끊어진 곳'을 스스로 찾아낼 수 있습니다.

구분 LLM (ChatGPT 등) 온톨로지 기반 시스템
잘하는 것 텍스트 읽기·요약·생성 관계 저장·탐색·비교
질문 방식 한 명씩, 한 건씩 300명을 한꺼번에
답의 형태 "위험해 보입니다" "이 세 관계가 끊어졌기 때문입니다"
설명 가능성 판단 경로 추적이 어려움 어떤 경로로 판단했는지 보여줄 수 있음

게다가 마지막 행은 더 중요합니다. 2026년 시행된 「인공지능기본법」은 사람의 권리에 영향을 미치는 AI에게 판단 근거의 설명을 요구합니다. 텍스트를 잘 쓰는 AI가 아니라, '왜 이 사람이 위험한가'를 경로로 보여줄 수 있는 AI — 그것은 관계가 구조화되어 있을 때 비로소 가능합니다. 

물론, 관계를 구조화한다는 것은 그만큼 많은 정보를 수집, 관리해야 하므로 조심해야 합니다. 이 이야기는 5편에서 하겠습니다.


방법론은 이미 있다


솔직히 말해서 이 온톨로지 방법론을 가장 대규모로, 그리고 성공적으로 구현한 기업이 팔란티어(Palantir)입니다. 사람과 장소와 사건 사이의 관계를 구조화하여, 수만 개의 점 사이에서 의미 있는 패턴을 찾아냅니다. 영국 정부는 이 기술로 우크라이나 난민 12만 8천 명의 재정착을 지원했고, 2천 명이 넘는 워커가 같은 화면에서 사례를 공유했습니다.


기술은 이미 존재합니다. 대규모 현장에서 작동한다는 것도 증명되었습니다. 안타깝고 슬프지만 지금 이 순간에도 같은 기술이 전장에서도 쓰이고 있습니다. 관계를 구조화하는 능력은 어디에서든 작동합니다.


다만 우려가 있습니다. 전장의 그림자 때문에 온톨로지라는 방법론 자체가 외면당하면, 복지 현장은 관계를 구조화할 좋은 기회를 잃어버리게 됩니다.


제가 이번 시리즈 'AI 시대를 위한 데이터 설계 방법론'에서 주목하는 것은 특정 기업이 아니라, 그 방법론 — 관계를 구조화하는 기술 — 이 복지 현장에서 어떤 가능성을 여는지입니다.


걱정됩니다


지금 대한민국 정부는 움직이고 있습니다. 소버린 AI를 위한 국가 모델 선정, 공공 영역 전반의 AI 실증 사업. 사회복지 현장에도 이미 AI 안부콜이 도입되고 있고, 각종 위기 징후를 포착하여 경고하는 시스템이 만들어지고 있습니다.


필요한 일입니다. 하지만 한 가지가 빠져 있습니다.


관계의 구조입니다.


안부콜은 전화를 겁니다. 위기 징후 시스템은 체납이나 단전 같은 행정 데이터를 스크리닝합니다. 상담 일지 AI는 텍스트를 요약합니다. 모두 유용합니다. 하지만 이 모든 것은 한 사람씩, 한 건씩 처리합니다. 관계의 구조 없이 도입되면, 노크 대신 알림이, 실천지혜 대신 점수가 사람을 판단하게 됩니다. 300명의 관계를 한꺼번에 보고, 어디에서 연결이 끊어졌는지 구조적으로 파악하는 것은 이 시스템들이 할 수 없습니다. 그런 구조가 데이터에 없기 때문입니다.


어쩌면 그동안 현장이 지켜온 관계가 사라질 수도 있습니다. 사람과 이웃과 기관과 지역사회 사이의 관계가 데이터에 존재하지 않으면, AI가 아무리 빨라도 생태체계를 분석할 수 없습니다. 우리에게 필요한 것은 더 빠른 AI가 아니라, AI가 볼 수 있는 관계의 구조입니다. 그 구조를 만드는 방법이 온톨로지입니다. 관계를 대체하기 위해서가 아니라, 관계를 지키기 위해서입니다.


다음 편에서는 이 관계의 구조를 어떻게 설계하는지 이야기하겠습니다.

※ 이 저작물은 크리에이티브 커먼즈 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 이용할 수 있습니다.

댓글

댓글

댓글 1