2025. 9. 12. | Vol. 25-34 | 📬구독하기 |
|
|
AI는 피노키오? "모른다" 답할 용기를 주자
- Open AI, 인공지능의 환각을 줄일 수 있는 보고서 발표 |
|
|
AI의 환각 문제는 연구자뿐 아니라 이용자 모두가 겪는 난제입니다. 아무리 뛰어난 AI라도 종종 틀린 답변을 사실처럼 자신 있게 말하곤 하지요. 단순한 기술적 버그라면 빠른 시일 내 해결될 수 있겠지만, 모델의 훈련·평가 방식에서 비롯된 문제라면 근본적인 변화가 필요합니다.
최근 OpenAI 연구진이 이 주제를 다룬 보고서를 발표했습니다. 복잡한 보고서의 핵심을 간단히 정리해 드립니다.
🤔 AI는 왜 틀린 답을 자신 있게 말할까?
1. 정확도 중심 평가의 함정 현재의 평가 시스템은 정답이면 점수를 주고, 틀리거나 “모르겠다”고 하면 0점을 줍니다. 이 때문에 모델은 “모른다”보다는 추측이라도 하는 게 유리해집니다.
2. ‘다음 단어 예측’ 방식의 한계 대규모 언어 모델은 문법과 패턴에는 강하지만, 특정인의 생일처럼 잘 알려지지 않은 사실은 맞히기 어렵습니다. 이럴 때 그럴듯하지만 틀린 답이 나오게 됩니다.
💡 OpenAI의 제안: 평가 방식을 바꾸자
OpenAI는 평가 기준을 이렇게 바꾸자고 제안합니다:
-
확신에 찬 오답은 감점
-
불확실성을 인정하면 부분 점수 부여
마치 SAT 시험의 감점 제도와 비슷한 아이디어인데요. 이렇게 하면 모델이 “아는 척”보다는 “모른다”고 말할 용기를 배울 수 있다는 것입니다.
결국 AI의 환각은 잘못된 인센티브 설계에서 비롯된 문제일 수 있습니다. 평가 방식을 바꾼다면, 더 정직하고 신뢰할 수 있는 AI가 등장할지도 모릅니다. |
|
|
국무부 요원까지 이민자 단속에 투입하는 미국
- 일부 비판적 시각..."NASA 간첩 사건을 국세청 요원이 조사하는 꼴" |
|
|
지난 4일, 미국 이민세관단속국(ICE)이 현대자동차와 LG에너지솔루션 합작 배터리 공장 건설 현장을 급습해 한국인 파견 직원 300여 명을 체포하는 충격적인 사건이 벌어졌습니다. 체포된 직원들이 일단 무사히 귀국하게 되면서 이번 상황은 일단락될 것으로 보이지만, 이번 일은 우리 기업들의 대미 투자 환경에도 적지 않은 파장을 남길 것으로 보입니다.
단속이 벌어진 4일, WIRED는 이민 단속과 관련한 흥미로운 보도를 내놓았습니다. 이민자 단속과 관련해 미국 국내 상황을 엿볼 수 있어 소개합니다.
❗ “IRS 요원이 NASA 간첩 사건을 수사하는 격” Wired의 보도에 따르면, 미국 국무부 외교안보국 산하 외교안보수사대(DSS, Diplomatic Security Service) 요원들이 ICE와 함께 이민 단속 활동에 동원되고 있습니다. DSS는 원래 여권·비자 사기, 국무장관과 해외 파견 외교관 경호 등 제한된 임무만 맡는 조직으로, 이민 단속은 분명 권한 밖의 업무입니다.
WIRED가 확보한 내부 정보와 전·현직 요원들의 증언에 따르면, DSS는 ICE와 합동 작전에 참여할 뿐 아니라 이민 단속 관련 업무 시간을 기록하라는 지침까지 받은 것으로 확인됐습니다. 한 요원은 이를 두고 “국세청 요원이 NASA의 간첩 사건을 수사하는 격”이라고 강하게 비판했습니다.
🏛️ 정치적 배경 이 같은 변화는 트럼프 행정부의 강경한 이민 단속 정책 확대와 맞물려 있습니다. 국토안보부는 지난 2월, 2,500여 명의 DSS 요원 중 600명을 불법 체류자 체포 및 추방 지원 임무에 투입하기로 합의했다고 발표했습니다. 이어 국무부는 ‘재이민(remigration) 사무국’을 신설해 이민자 추적을 중앙 관리하겠다고 밝혔습니다. 사실상 ‘추방’을 뜻하는 이 개념은 극우 진영이 주장해온 정책과 궤를 같이합니다.
⚠️ 현장의 우려 문제는 DSS 요원들이 이민 행정영장 집행 경험이 전혀 없다는 점입니다. 한 전직 요원은 “DSS는 이민 관련 영장을 다룰 권한도 경험도 없다”고 지적했습니다. 현직 요원 역시 “최소한의 훈련만 받은 인력이 이민법을 집행하면서 시민권 침해 위험이 커지고 있다”고 우려했습니다.
한국인 파견 직원들을 쇠사슬로 묶어 체포하는 충격적 장면은, 이민자 단속 당국의 과도한 실적 챙기기 이유도 있겠지만 권한과 경험이 부족한 요원들을 무분별하게 현장에 투입한 결과가 아니었는지도 한번 따져볼 필요가 있겠습니다. |
|
|
미국은 2차 전지를 왜 만들지 못할까?
- 2차전지 스타트업 Natron 파산, 후발주자의 구조적 약점만 드러내 |
|
|
나트륨이온 기반 2차전지 상용화를 목표로 했던 미국 스타트업 Natron이 창업 12년 만에 문을 닫았습니다.
Natron은 2,500만 달러 규모의 주문을 확보했지만, 상용화에 필수적인 UL 안전 인증을 끝내 받지 못했습니다. 여기에 투자자들이 추가 자금 지원을 거부하면서 현금 유동성 위기를 넘지 못하고 결국 청산 절차에 들어갔습니다.
이 사건은 “미국이 독자적으로 배터리 산업을 키우는게 얼마나 어려운지”를 잘 보여줍니다.
⚡ 미국의 배터리 제조가 어려운 이유
-
투자 사이클의 벽 기가팩토리 규모로 성장하기까지는 최소 10년 이상이 걸립니다. 하지만 벤처 투자 사이클은 그보다 훨씬 짧습니다. 실제로 한국 LG그룹도 1998년부터 2차전지 상용화를 시작했지만, 첫 흑자를 기록한 건 2020년이었습니다.
-
중국의 압도적 생태계 중국은 수십 년간 공급망과 제조 경험을 쌓으며 가격 경쟁력을 확보했습니다. Natron은 리튬보다 저렴한 나트륨이온 전지로 차별화를 시도했지만, 지난 2년 반 동안 리튬 가격이 90% 폭락하면서 강점이 사라졌고, 이는 결국 파산으로 이어졌습니다.
🌍 구조적 위기, 미국·유럽 공통의 문제
파산한 것은 Natron만이 아닙니다.
이제 미국과 유럽의 배터리 독립은 구조적으로 불가능하다고 볼 수 있습니다.
친환경에너지로의 전환 과정에서 2차 전지산업은 핵심입니다. 2차 전지 산업을 주도하는 중국의 에너지 패권이 점점 강해질 것은 명확관화합니다. 미국과 유럽이 결국 선택할 수 있는 길은 명확해 보입니다.
"한국 기업과 손잡을 것인가 말 것인가", "언제 손잡을 것인가"
|
|
|
🚀 오노마에이아이: 생성형 AI 전문기업 오노마에이아이가 일본 AI 스타트업 AiHUB와 AI 솔루션 공동연구 및 개발을 위한 업무협약을 체결했습니다.
🚀 다비다: 다비다가 브라질 기업 MKR과 인공지능 기반 학습 솔루션 ‘지니티쳐’의 브라질 내 독점 공급 계약을 체결했습니다.
🚀 메이저맵: 진로정보 서비스 기업 메이저맵이 베트남 IT 기업 VTC-Online과 베트남 학생들을 위한 진로 교육 서비스 공동 개발을 위한 업무협약을 체결했습니다. |
|
|
2025년 9월까지 유럽에서 12개 유니콘 탄생
미국 스타트업 투자 시장이 가장 크긴하지만, 유럽 투자시장 역시 무시못할 사이즈를 갖고 있습니다. 특히 소버린 AI에 대한 관심이 높아지면서 AI 분야를 중심으로 투자가 늘어나고 있습니다. 올해 벌써 12개 스타트업이 기업가치 10억 달러 이상을 인정받아 유니콘 기업으로 부상했습니다. AI외에도 전통적 투자처인 바이오 헬스케어 분야 기업들도 눈에 띄고, 특히 러시아-우크라이나 전쟁의 영향 탓인지 방산·우주 기술 분야 기업도 강세를 보이고 있습니다.
🚀 2025년에 나온 유럽 유니콘
-
IQM (핀란드): 양자컴퓨터 스타트업, 시리즈 B에서 3억 달러 조달, 총 6억 달러 → 글로벌 양자컴퓨터 판매 1위
-
Framer (네덜란드): 노코드 웹사이트 빌더, 시리즈 D로 20억 달러 가치 평가
-
Lovable (스웨덴): AI 기반 ‘바이브 코딩’ 스타트업, 설립 8개월 만에 18억 달러 기업가치
-
Fuse Energy (영국): 전직 Revolut 임원이 설립한 재생에너지 기업, 10억 달러 이상 가치 확보
-
Mubi (영국): 영화 스트리밍·제작 플랫폼, 세쿼이아 리드 투자로 유니콘 진입
-
Zama (프랑스): 동형암호 기술 스타트업, 5,700만 달러 조달로 10억 달러 돌파
-
Isar Aerospace (독일): 뮌헨공대 출신 우주 발사체 기업, 1억7,300만 달러 전환사채 투자 유치
-
Tekever (포르투갈): 군·민간 겸용 드론 스타트업, 10억 파운드 이상 가치
-
Quantum Systems (독일): 자율형 드론·AI 스타트업, 1억7,200만 달러 시리즈 C로 유니콘 달성
-
Parloa (독일): 고객 서비스용 대화형 AI 플랫폼, 1억2천만 달러 시리즈 C로 기업가치 10억 달러
-
Verdiva Bio (영국): GLP-1 기반 비만 치료제 파이프라인, 첫 라운드부터 4억1천만 달러 투자 유치
-
Neko Health (스웨덴): 스포티파이 공동창업자 Daniel Ek이 세운 예방의학 헬스케어 스타트업, 18억 달러 가치
|
|
|
4F, Startup Campus Building #3, 20, Pangyo-ro 289, Bundang, Seongnam, Korea 13488
You are receiving this email because you have visited our site or asked us about regular newsletter.
|
|
|
|
|