인공지능 AI 뉴스 - 2025년 3월 19일

Table of Contents

OpenAI의 ChatGPT 업데이트: GPT-4o-mini의 성능 개선

A futuristic AI model visualizing real-time search capabilities with a glowing neural network interface.

미국 시간 3월 18일 오전에 X에서 여러 사용자가 OpenAI가 ChatGPT에 통합된 소형 모델 “GPT-4o-mini”의 업데이트를 발표했다는 소식을 공유했습니다. 이 업데이트는 STEM(과학, 기술, 공학, 수학) 분야에서 정확도가 85% 이상으로 향상되었으며, 응답 속도가 기존 모델보다 30% 빨라졌다는 내용이었습니다. 특히, 실시간 웹 검색 기능이 강화되어 최신 정보를 기반으로 한 답변이 가능해졌다는 점이 강조되었습니다. 한 사용자는 “GPT-4o-mini가 이제 Claude 3보다 과학 문제 풀이에서 더 나은 성능을 보인다”라며 테스트 결과를 스크린샷으로 공유했습니다. 또 다른 사용자는 “비디오 생성은 아니지만, 텍스트 입력으로 간단한 다이어그램을 그려주는 기능이 추가되었다”라고 언급하며 OpenAI가 멀티모달 방향으로 나아가고 있다고 추측했습니다.

Claude 3.5 Sonnet의 이미지 분석 기능 논란

Anthropic의 Claude 3.5 Sonnet에 대한 이야기도 X에서 활발히 논의되었습니다. 3월 18일 포스트에 따르면, Claude가 이미지 입력을 처리하는 능력이 ChatGPT보다 뛰어나다는 의견이 있었으나, 일부 사용자는 “복잡한 이미지에서 오답을 내놓는 경우가 잦다”라며 실망감을 표출했습니다. 예를 들어, 한 사용자가 업로드한 차트 이미지에 대해 Claude가 잘못된 데이터를 해석했다는 사례가 공유되었습니다. 반면, 긍정적인 피드백으로는 “텍스트 생성은 여전히 Claude가 최고”라는 의견이 다수였으며, 특히 긴 문맥을 유지하는 능력이 ChatGPT보다 낫다는 평가가 이어졌습니다.

Google Gemini: 비디오 생성 기능 루머

Gemini 관련해서는 3월 18일 X에서 “Google이 Gemini에 비디오 생성 기능을 통합할 계획”이라는 루머가 퍼졌습니다. 한 사용자는 “내부 소식통에 따르면, Gemini가 다음 분기에 DALL-E 3 수준의 이미지 생성과 함께 짧은 비디오 클립 생성을 지원할 것”이라며 기대감을 드러냈습니다. 그러나 공식 발표는 없었고, 커뮤니티에서는 “구글의 발표 속도가 느려 실망스럽다”는 반응도 있었습니다.

xAI의 Grok 3 오픈소스 활용 사례

xAI의 Grok 3에 대한 소식도 눈에 띄었습니다. 3월 18일 X에서 한 개발자가 “Grok 3의 오픈소스 모델을 로컬에 설치해 커스터마이징한 결과, 특정 도메인(우주 탐사)에 특화된 챗봇을 만들었다”라며 코드를 공유했습니다. Grok 3는 314B 파라미터를 자랑하며, Mixture of Experts(MoE) 아키텍처를 통해 효율적인 연산이 가능하다는 점이 다시 한번 화제가 되었습니다. 다른 사용자는 “Grok 3가 ChatGPT보다 더 ‘인간적인’ 답변을 준다”라며, xAI가 주장하는 ‘최대 진실 탐구’ 철학이 반영된 사례를 언급했습니다.

ChatGPT vs. Claude 벤치마크 비교

레딧의 서브레딧에서 3월 18일에 게시된 한 스레드는 ChatGPT(GPT-4o-mini)와 Claude 3.5 Sonnet의 최신 벤치마크 결과를 다루었습니다. 사용자가 MMLU(대규모 다중 작업 언어 이해) 테스트에서 두 모델을 비교한 결과, GPT-4o-mini가 88.7%, Claude가 87.2%를 기록하며 근소한 차이로 GPT-4o-mini가 앞섰다는 내용이었습니다. 댓글에서는 “Claude는 코드 생성에서 여전히 약하고, 이미지 분석은 기대 이하”라는 비판과 “ChatGPT의 실시간 검색이 게임 체인저”라는 호평이 공존했습니다.

Grok 3 커뮤니티 프로젝트

Grok 3의 오픈소스 배포를 활용한 커뮤니티 프로젝트가 화제였습니다. 3월 18일 포스트에서 한 사용자가 “Grok 3를 기반으로 로컬에서 작동하는 이미지 설명 생성기를 만들었다”라며 GitHub 링크를 공유했습니다. 이 프로젝트는 Grok 3의 텍스트 처리 능력을 활용해 업로드된 이미지에 대한 상세 설명을 생성하는 데 초점을 맞췄습니다. 댓글에서는 “xAI가 오픈소스를 통해 생태계를 확장하려는 전략이 성공적”이라는 평가가 많았습니다.

이미지 생성 트렌드

DALL-E 3와 Midjourney의 최신 트렌드가 논의되었으며, 3월 18일 한 사용자가 “ChatGPT에 통합된 DALL-E 3가 텍스트-이미지 생성에서 여전히 선두”라며 샘플 이미지를 업로드했습니다. 그러나 “비디오 생성은 여전히 Midjourney가 앞선다”는 의견도 있었고, “Gemini가 이 경쟁에 끼어들면 흥미로워질 것”이라는 기대감이 담긴 댓글이 달렸습니다.

이전 글: GTC 2025 키노트 젠슨황 엔비디아

인공지능 AI 뉴스 – 2025년 3월 19일

OpenAI의 ChatGPT 업데이트: GPT-4o-mini의 성능 개선

Claude 3.5 Sonnet의 이미지 분석 기능 논란

Google Gemini: 비디오 생성 기능 루머

xAI의 Grok 3 오픈소스 활용 사례

ChatGPT vs. Claude 벤치마크 비교

Grok 3 커뮤니티 프로젝트

이미지 생성 트렌드

1 Comment

Leave a Reply Cancel reply

뉴스레터를 받아보세요.

Trending Post

Social Media