Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
News
Sports
TV & Film
About Us
Contact Us
Copyright
© 2024 PodJoint
00:00 / 00:00
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts122/v4/4b/f3/e9/4bf3e9f2-e8e1-0d40-1f66-5521fb47b9cf/mza_2108360764140623671.jpg/600x600bb.jpg
Опівночні Балачки
Денис, Ігор, Саша
45 episodes
6 days ago
Машинне навчання (Machine Learning aka ML), програмування і драми в айті. 🇺🇦україномовний, наскільки ми можемо🇺🇦 Про технології і штучний інтелект від айтівців.
Show more...
Technology
RSS
All content for Опівночні Балачки is the property of Денис, Ігор, Саша and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
Машинне навчання (Machine Learning aka ML), програмування і драми в айті. 🇺🇦україномовний, наскільки ми можемо🇺🇦 Про технології і штучний інтелект від айтівців.
Show more...
Technology
https://d3t3ozftmdmh3i.cloudfront.net/production/podcast_uploaded_nologo/9836399/9836399-1652646831670-bfe32084044ad.jpg
№32: Пошукова система Github
Опівночні Балачки
35 minutes 40 seconds
2 years ago
№32: Пошукова система Github

🔞 Тут будуть матюки 🔞

Робочі посилання і коментарі в каналі https://t.me/midnight_chatter

  • 0:00-2:50 Intro. Спеціалізовані і генералізовані системи пошуків.
  • 2:51-9:12 Чому у Github була найгірша система пошуку? Натягуємо Elastic на код, який не є натуральною мовою. BM25 “на пальцях”. Ну і неймдропаємо Tf-Idf
  • 9:13-12:26 Повертаємося до оригінального блогпосту. Як весь код вліз в 25Тб? І інші цифри для оцінки масштабу розміру пошукової бази
  • 12:27-15:02 Які кола мікросервісів проходить ваш код перед тим, як потрапити в видачу пошуку? Самописні бази на такому швидкому і безпечному Rust, а також ліричні відступи з шеймінгом людей за спадок на Golang
  • 15:03-22:26 Що в цій базі? Інвертовані індекси, щоб не лупати днями всі документи в циклі. Триграми з прикладами “📃” ➡️👨‍⚕️,うく,💦. Як ділити величезний індекс по різних серверах? Трохи про шардінг, але може краще почитайте “кабанчика”. PGTune
  • 22:26-25:24 Як відбувається безпосередньо пошук?
  • 25:25-30:17 Невеликі, здавалося б, оптимізації, які значно покращували все: мінімальне остовне дерево, k-мердж списків, … Зато за 36 годин все переіндексовують з нуля, як треба буде
  • 30:18-34:25 На чому все це крутиться? І навіщо взагалі треба пошук по коду? Даєш ReversoContext для коду!
  • 34:26-35:40 Outro

Долучайтесь до наших соцмереж:

  • https://t.me/midnight_chatter
  • Twitter @O_Balachky
  • TikTok @o_balachky

Музика: https://www.streambeats.com/ | @stasgavrylov

Опівночні Балачки
Машинне навчання (Machine Learning aka ML), програмування і драми в айті. 🇺🇦україномовний, наскільки ми можемо🇺🇦 Про технології і штучний інтелект від айтівців.