Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
History
News
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/7d/f3/0f/7df30fc8-a9ad-9ee0-19df-2edc6c4d9f36/mza_17773036082296723187.jpg/600x600bb.jpg
AI Engineering Now
AI Engineering Now
15 episodes
6 days ago
ソフトウェアエンジニアのseya(@sekikazu01)とkagaya(@ry0_kaga)の2人が、生成AI、LLM、AIエンジニアリングのニュースや技術、論文を題材に雑談するPodcastです。 ポッドキャストの書き起こしサービス「LISTEN」: https://listen.style/p/aiengineeringnow?2mTTXqSs ハッシュタグ: #ai_eng_now 出演者: seya(@sekikazu01) kagaya(@ry0_kaga)
Show more...
Technology
RSS
All content for AI Engineering Now is the property of AI Engineering Now and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
ソフトウェアエンジニアのseya(@sekikazu01)とkagaya(@ry0_kaga)の2人が、生成AI、LLM、AIエンジニアリングのニュースや技術、論文を題材に雑談するPodcastです。 ポッドキャストの書き起こしサービス「LISTEN」: https://listen.style/p/aiengineeringnow?2mTTXqSs ハッシュタグ: #ai_eng_now 出演者: seya(@sekikazu01) kagaya(@ry0_kaga)
Show more...
Technology
https://d3t3ozftmdmh3i.cloudfront.net/staging/podcast_uploaded_nologo/41915474/41915474-1725803370927-9b33b08aae768.jpg
#1: Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作る
AI Engineering Now
32 minutes 59 seconds
1 year ago
#1: Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作る

Chatbot Arenaのデータを使ってドメイン独自の評価データセットを作るという論文、Judging LLM-as-a-Judge with MT-Bench and Chatbot Arenaを題材に話しました。


ポッドキャストの書き起こしサービス「LISTEN」はこちら

Shownotes:

Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Chat with Open Large Language Models

From Live Data to High-Quality Benchmarks: The Arena-Hard Pipeline | LMSYS Org

Benchmarks 201: Why Leaderboards > Arenas >> LLM-as-Judge

https://x.com/karpathy/status/1737544497016578453

https://github.com/lm-sys/arena-hard-auto/tree/main/BenchBuilder


出演者:

seya(@sekikazu01)

kagaya(@ry0_kaga)

AI Engineering Now
ソフトウェアエンジニアのseya(@sekikazu01)とkagaya(@ry0_kaga)の2人が、生成AI、LLM、AIエンジニアリングのニュースや技術、論文を題材に雑談するPodcastです。 ポッドキャストの書き起こしサービス「LISTEN」: https://listen.style/p/aiengineeringnow?2mTTXqSs ハッシュタグ: #ai_eng_now 出演者: seya(@sekikazu01) kagaya(@ry0_kaga)