2026.02.01 (일)

  • 맑음동두천 0.1℃
  • 맑음강릉 4.3℃
  • 맑음서울 0.1℃
  • 맑음대전 2.0℃
  • 맑음대구 3.4℃
  • 맑음울산 3.8℃
  • 맑음광주 4.5℃
  • 맑음부산 5.7℃
  • 맑음고창 3.7℃
  • 구름많음제주 7.1℃
  • 맑음강화 -0.3℃
  • 맑음보은 1.1℃
  • 맑음금산 2.1℃
  • 구름많음강진군 4.9℃
  • 맑음경주시 3.7℃
  • 맑음거제 4.8℃
기상청 제공

삼성전자, AI 업무 생산성 측정 지표 벤치마크 '트루벤치' 공개

실제 업무 환경 반영·다국어 지원으로 차별화…기술 리더십 강화

 

삼성전자가 자체 개발한 AI 업무 생산성 벤치마크 '트루벤치(TRUEBench)'를 공개했다고 밝혔다.

 

트루벤치는 삼성전자 DX 부문의 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발했으며, AI 모델의 업무 생산성 성능을 평가하는 데 특화됐다.

 

삼성전자는 기존 AI 벤치마크가 대부분 영어를 중심으로 하거나 단발성 대화를 평가하는 한계에 주목했다. 이에 트루벤치는 실제 오피스 업무에서 자주 활용되는 콘텐츠 생성, 데이터 분석, 문서 요약 및 번역 등 10개 카테고리, 46개 업무, 2,485개 세분화된 항목으로 구성하여 실제 업무 상황을 폭넓게 평가한다.

 

특히 트루벤치는 총 12개 언어를 지원하며, 영어와 한국어 등 여러 언어가 혼합된 교차 언어 번역 기능까지 평가할 수 있는 점이 특징이다. 또한 한 번에 최대 5개 모델을 비교할 수 있는 리더보드와 상세 항목별 점수를 제공해 사용자가 AI 모델의 성능을 한눈에 파악할 수 있도록 했다. 삼성전자는 트루벤치의 데이터 샘플과 리더보드를 글로벌 오픈소스 플랫폼인 허깅페이스에 공개했다.

 

트루벤치는 답변의 정확성뿐만 아니라 겉으로 드러나지 않는 사용자의 의도와 맥락까지 평가할 수 있도록 설계됐다. AI가 평가 기준을 검토하고 교차 검증하는 방식을 도입해 주관적 편향을 최소화하고 일관성 있는 평가 결과를 제공한다고 전했다.

 

DX부문 최고기술책임자(CTO) 겸 삼성리서치장 전경훈 사장은 "삼성 리서치는 다양한 실제 적용 사례를 바탕으로 차별화된 생산성 AI 기술 경쟁력과 노하우를 보유하고 있다"며, "트루벤치 공개를 통해 생산성 성능 평가 기준을 정립하고 기술 리더십을 더욱 공고히 할 것"이라고 말했다.



배너
배너

라이프&health

더보기
'미식의 꽃' 한우, 대표 식재료 넘어 'K-미식' 정점에 우뚝
최근 전 세계를 사로잡은 요리 서바이벌 예능에서 한우가 다시 한번 '미식의 꽃'으로 주목받고 있다. 특히 까다로운 심사위원들의 입맛을 단번에 사로잡은 ‘한우 마늘갈비구이’는 한우만이 지닌 깊은 풍미를 극대화했다는 평을 받으며 미식가들 사이에서 화제를 모으고 있다. 이에 한우자조금관리위원회(위원장 민경천, 이하 한우자조금)는 시청자들이 가정에서도 손쉽게 한우를 경험 할 수 있도록 한우 갈비를 활용한 화제의 레시피를 소개하고 한우의 미식적 가치를 알리고자 나섰다. 한우 갈비는 단순한 구이용 부위를 넘어, 뼈 주변의 살코기와 지방이 조화롭게 어우러져 씹을수록 풍부한 육향과 감칠맛을 느낄 수 있는 부위다. 갈비뼈에서 우러나는 고소한 맛과 함께 육즙이 풍부해 구이, 양념구이, 갈비찜, 바비큐 등 다양한 조리법에 폭넓게 활용된다. 특히 한우 고유의 균일한 마블링과 함께 단백질, 철분, 콜라겐 등의 영양소가 골고루 함유되어 있어 맛은 물론 기력 보충에도 도움을 주며, 남녀노소 누구에게나 선호도가 높다. 예능에서 화제가 된 ‘한우 마늘갈비구이’는 한국적인 재료의 조화를 현대적으로 풀어낸 것이 특징이다. 알싸한 마늘을 참기름에 볶아 단맛을 끌어올린 뒤 구운 한우 갈비에 곁들

배너
배너