Home
Categories
EXPLORE
True Crime
Comedy
Society & Culture
Business
Sports
Health & Fitness
Technology
About Us
Contact Us
Copyright
© 2024 PodJoint
Loading...
0:00 / 0:00
Podjoint Logo
US
Sign in

or

Don't have an account?
Sign up
Forgot password
https://is1-ssl.mzstatic.com/image/thumb/Podcasts221/v4/1d/be/b1/1dbeb16e-7e86-35cb-cb1c-e23989789ca0/mza_14788220863973116958.jpg/600x600bb.jpg
OTF Talk
Akira Shimosako
34 episodes
5 days ago
OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 (host: @simosako) https://www.otftalk.com/
Show more...
Technology
RSS
All content for OTF Talk is the property of Akira Shimosako and is served directly from their servers with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 (host: @simosako) https://www.otftalk.com/
Show more...
Technology
Episodes (20/34)
OTF Talk
#34 Apache Kafka と Open Table Format

OTF Talk 第34回はConfluent 清水 亮夫 さんに、「Apache Kafka と Open Table Format」についてお話をうかがいました。


リアルタイム処理とOTF/Kafkaの特徴/Kafkaと他システムとの連携/Kafka Connector/Iceberg Sink Connectorの機能と注意点


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: Confluent ソリューションエンジニアの清水 亮夫 さん


host: @simosako 下佐粉 昭

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

清水さん X https://x.com/shmza

Apache Iceberg Meetup Japan #3 https://iceberg.connpass.com/event/364492/

発表資料 https://speakerdeck.com/shmza/kafkawoli-yong-sitaiceberghenodetasutorimingu


Apache Kafka https://kafka.apache.org/

Kafka connectors https://docs.confluent.io/platform/current/connect/kafka_connectors.html

Apache Iceberg Sink Connector https://github.com/apache/iceberg/tree/main/kafka-connect

Kafka-delta-ingest https://github.com/delta-io/kafka-delta-ingest


Show more...
5 days ago
27 minutes 36 seconds

OTF Talk
#33 大規模データ分析環境での Apache Iceberg + Snowflake 活用の経験

OTF Talk 第33回はNTTドコモ 松原 侑哉 さんに、「大規模データ分析環境での Apache Iceberg + Snowflake 活用の経験」についてお話をうかがいました。


ペタバイト級データを処理するインフラの変遷/Iceberg評価の背景とモチベーション/ベンチマークの方法と結果/今後について


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: NTTドコモ プリンシパルデータエンジニア 松原 侑哉 さん


host: @simosako 下佐粉 昭

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)


Apache Iceberg Meetup Japan #3

https://iceberg.connpass.com/event/364492/


松原さん発表資料

https://speakerdeck.com/y_matsubara/apache-iceberg-meetup-japan-number-3-da-gui-mo-snowflake-plus-anoicebergnohuo-yong


Show more...
1 week ago
21 minutes 16 seconds

OTF Talk
#32 広告配信システムのデータ基盤におけるApache Iceberg活用

OTF Talk 第32回はマイクロアド 高橋 唐樹 さんに、「広告配信システムのデータ基盤におけるApache Iceberg活用」についてお話をうかがいました。


広告配信システムの前処理/HiveからTrinoに移行/Iceberg化のメリット/ストレージとコンピュートの分離によるメリット


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: マイクロアド 高橋 唐樹 さん


host: @simosako 下佐粉 昭

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


--------------------


参考)


発表資料 https://sd-portal.microad.co.jp/slides/2025-03-01_deim2025.html


DEIM2025 https://pub.confit.atlas.jp/ja/event/deim2025


OTF Talk 「マイクロアドでのOTF活用とIcebergテーブルの最適化」#28 https://www.otftalk.com/2025/09/ep14.html


OTF Talk 「LINEヤフーにおけるHiveからIcebergへの移行」(#17, #18) https://www.otftalk.com/2024/11/ep8.html


Show more...
2 weeks ago
23 minutes 42 seconds

OTF Talk
#31 Fin Tech領域における Open Table Format

OTF Talk 第31回は鈴木 研吾 さんに、「Fin Tech領域における Open Table Format」についてお話をうかがいました。


セキュリティ・キャンプ2025 全国大会/データマネジメントの重要性/Fin Tech領域とOpen Table Formatのメリット/AI時代のセキュリティ


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @ken5scal (ken\d\x) 鈴木 研吾 さん


host: @simosako 下佐粉 昭

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


--------------------


参考)


鈴木さん X https://x.com/ken5scal (ken\d\x)


セキュリティ・キャンプ2025 全国大会【専門】Dクラス

https://www.ipa.go.jp/jinzai/security-camp/2025/camp/zenkoku/program/d.html


講義資料

https://speakerdeck.com/ken5scal/aishi-dai-noda-gui-mo-detahuo-yong-tosekiyuriteizhan-lue


LayerX Fintech事業部ブログ

https://tech.layerx.co.jp/archive/category/Fintech%E4%BA%8B%E6%A5%AD%E9%83%A8


SIEM https://ja.wikipedia.org/wiki/Security_information_and_event_management

Show more...
3 weeks ago
23 minutes 33 seconds

OTF Talk
#30 柔軟性のある分析基盤構築のためにApache Icebergを活用した経験

OTF Talk 第30回は坂本 泰規さんに、「柔軟性のある分析基盤構築のためにApache Icebergを活用した経験」についてお話をうかがいました。


Apache Iceberg採用のモチベーション/マルチクラウド/クエリエンジンを併用 - SnowflakeとAthena/性能と注意点


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @sambaiz 坂本 泰規さん


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


--------------------


参考)


坂本さん X https://x.com/sambaiz


「AJA SSP が Apache Iceberg と AWS Glue Data Catalog でペタバイトスケールのデータ基盤の柔軟なクエリエンジンの選択とクエリの高速化を実現」(AWSブログ)

https://aws.amazon.com/jp/blogs/news/aja-ssp-adopts-iceberg-and-glue-data-catalog-in-peta-byte-scale-data-platform-to-get-flexible-query-engines-and-faster-queries/


OTF Talk #13 「DWH利用者からみた Iceberg の魅力」

https://www.otftalk.com/2024/10/ep6.html


Show more...
1 month ago
23 minutes 49 seconds

OTF Talk
#29 関西でのOTFコミュニティ活動

OTF Talk 第29回は、さくらインターネットの永富 安和さん(やっさん)に「関西でのOTFコミュニティ活動 」についてお話をうかがいました。


OTFSGとコミュニティ活動/OTF周辺での関心領域/関西でのコミュニティ活動/OTFSG今後の予定


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @yassan168 永富 安和さん(やっさん)

さくらインターネット ソフトウェア開発エンジニア


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


--------------------

参考)

やっさん X https://x.com/yassan168


OTFのコミュニティ OTF Study Group (OTFSG) https://otfsg-tokyo.connpass.com/

(OTFSG Slack への招待リンクも上記URLに記載されています)


資料 「マイクロアドのData LakehouseとIcebergテーブルの最適化について」

https://docs.google.com/presentation/d/1w4mY_coUKPfMBbpvi-fJygmUZIvmh0q6ipG-BM1PxiM/edit?slide=id.g22df57b2e5d_0_0


上記発表の録画 https://youtu.be/jEH17or26b0?si=uv6-rO2UTBQSNeIc&t=284


RUSTFS (MiniIO alternative) https://github.com/RustFS/RustFS


Lake Keeper https://docs.lakekeeper.io/

--

ホストしているもう1つのPodcast : SKO Radio

https://www.skoradio.com/


Show more...
1 month ago
19 minutes 39 seconds

OTF Talk
#28 マイクロアドでのOTF活用とIcebergテーブルの最適化

OTF Talk 第28回はさくらインターネットの永富 安和さん(やっさん)に、「マイクロアドでのOTF活用とIcebergテーブルの最適化」についてお話をうかがいました。


マイクロアドのデータ基盤/当時の環境と課題/採用した構成と理由/ComputeとDataを分離する/Icebergのメンテナンス


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @yassan168 永富 安和さん(やっさん)

さくらインターネット ソフトウェア開発エンジニア


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。

--------------------


参考)


やっさん X https://x.com/yassan168


OTFのコミュニティ OTF Study Group (OTFSG) https://otfsg-tokyo.connpass.com/

(OTFSG Slack への招待リンクも上記URLに記載されています)


資料 「マイクロアドのData LakehouseとIcebergテーブルの最適化について」

https://docs.google.com/presentation/d/1w4mY_coUKPfMBbpvi-fJygmUZIvmh0q6ipG-BM1PxiM/edit?slide=id.g22df57b2e5d_0_0


上記発表の録画 https://youtu.be/jEH17or26b0?si=uv6-rO2UTBQSNeIc&t=284


RUSTFS (MiniIO alternative) https://github.com/RustFS/RustFS


Lake Keeper https://docs.lakekeeper.io/



--

ホストしているもう1つのPodcast : SKO Radio

https://www.skoradio.com/


Show more...
1 month ago
31 minutes 1 second

OTF Talk
#27 Apache Iceberg への移行戦略

OTF Talk 第27回は、AWSの疋田 宗太郎さんに「Apache Iceberg への移行戦略」についてお話をうかがいました。


なぜIcebergに移行するのか/検討が必要な項目 - ETL、クライアント、データ/移行戦略と移行の流れ/リライト戦略とインプレース戦略


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @_Bassari (疋田 宗太郎/べりんぐ)

AWSのソリューションアーキテクト。余暇はOTF/Iceberg関連の技術を探求中。


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

書籍:「実践Apache Iceberg」 技術評論社 (2025/8/27発売) https://amzn.to/419RgwS


OTF Talk #17, 18 奥田さんによるデータ移行の話 https://www.otftalk.com/2024/11/ep8.html

Netflixの移行事例 https://www.youtube.com/watch?v=jMFMEk8jFu8


Show more...
1 month ago
22 minutes 59 seconds

OTF Talk
#26 PyIcebergの活用

OTF Talk 第26回はAWSの疋田 宗太郎さんに、「PyIcebergの活用」についてお話をうかがいました。


PyIcebergとは?/ユースケース/メリット/制約・注意点


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest: @_Bassari (疋田 宗太郎/べりんぐ)

AWSのソリューションアーキテクト。余暇はOTF/Iceberg関連の技術を探求中。


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

書籍:「実践Apache Iceberg」 技術評論社 (2025/8/27発売) https://amzn.to/419RgwS


PyIceberg https://py.iceberg.apache.org/

GithubのIssue : Support IsolationLevels and Concurrency Safety Validation Checks

※ PyIcebergの同時書き込み時の競合チェックの改善について(競合しづらくする)

https://github.com/apache/iceberg-python/issues/819



Show more...
2 months ago
18 minutes 37 seconds

OTF Talk
#25 Apache Iceberg のパフォーマンス最適化

#25 Apache Iceberg のパフォーマンス最適化


OTF Talk 第25回は、AWSの田中 智大さんに「Apache Iceberg のパフォーマンス最適化」についてお話をうかがいました。


Icebergのパフォーマンスを決める要因/クエリ性能の最適化手法/書き込みの最適化手法


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest:tomtan (田中 智大)

AWSのシニア・クラウドサポートエンジニア(Bigdata profile)


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


--------------------


参考)

書籍:「実践Apache Iceberg」 技術評論社 (2025/8/27発売) https://amzn.to/419RgwS


Apache Icebergにおける同時実行制御の仕組みと注意点 (beringさんブログ)

https://bering.hatenadiary.com/entry/2025/01/18/234339


Show more...
2 months ago
16 minutes 30 seconds

OTF Talk
#24 Apache Iceberg v3 Spec

OTF Talk 第25回はAWSの田中 智大さんに、「Apache Iceberg v3 Spec」についてお話をうかがいました。


Iceberg本の出版/Iceberg Specとは何か?/v3の新機能 Row LinageとDeletion Vector/その他の新機能/v4に向けて


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest:tomtan (田中 智大)

AWSのシニア・クラウドサポートエンジニア (Bigdata profile)


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

書籍:「実践Apache Iceberg」 技術評論社 (2025/8/27発売) https://amzn.to/419RgwS


田中さんによるApache Iceberg V3 Spec解説

https://speakerdeck.com/tomtanaka/apache-iceberg-meetup-in-japan-number-1-iceberg-v3-spec

https://tomtan.dev/blog/2025-02-10-iceberg-v3-spec/

Apache Iceberg Table Spec https://iceberg.apache.org/spec/



Show more...
2 months ago
19 minutes 36 seconds

OTF Talk
#23 Apache Hudi 1.0 アナウンスブログを読む (番外編)

第23回は、ゲストなしの番外編として、Apache Hudi 1.0リリースのアナウンスブログを読む回です。また、最後に今後のOTF Talkについて少しご案内があります。


Apache Hudi 1.0 Release/次世代レイクハウス/1.0の新機能/OTF Talk今後の予定


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。

参考)


■Apahce Hudi

Announcing Apache Hudi 1.0 and the Next Generation of Data Lakehouses https://hudi.apache.org/blog/2024/12/16/announcing-hudi-1-0-0/


Apache Hudi 1.0 Release note https://hudi.apache.org/releases/release-1.0.0/


Apache Hudi Roadmap https://hudi.apache.org/roadmap/


■関連技術

LSM Tree

https://en.m.wikipedia.org/wiki/Log-structured_merge-tree


書籍「データ指向アプリケーションデザイン」(オライリー)

https://www.oreilly.co.jp/books/9784873118703/


Google Spanner TrueTimeと外部整合性 (Google) https://cloud.google.com/spanner/docs/true-time-external-consistency?hl=ja


■OTF Talk

https://www.otftal.com (ホームページ)

https://youtube.com/@otftalk (Youtubeチャンネル)

https://x.com/otftalk (X)

https://mixi.social/communities/627c99c6-0563-41e3-b875-4c07794674fc/about (Mix2 コミュニティ)

Podcastのはじめかた (OTF Talkの場合) https://portablecode.info/2024/12/30/how-to-start-a-podcast/

■ホスト:下佐粉 昭 (しもさこ あきら)

https://x.com/simosako (X)

https://mixi.social/@simosako (Mixi2)

3名でホストをしている Podcast - SKO Radio https://www.skoradio.com

Show more...
10 months ago
21 minutes 2 seconds

OTF Talk
#22 Delta Lake 実践事例

OTF Talk 第22回は、Databricksの桑野 章弘さんに「Delta Lake 実践事例」についてお話をうかがいました。


Delta Lake ユースケース/機械学習もDWHも同じ環境で/事例/Delta Lakeを選択した理由


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest:@kuwa_tw

Databricks ソリューションアーキテクト


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

桑野さん Xアカウント https://x.com/kuwa_tw


Databrics https://www.databricks.com/jp


Delta Lakeとは? (Databricksドキュメント)

https://docs.databricks.com/ja/delta/index.html


Delta Lakeクイックスタートガイド (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/345f503d5f8177084f24


Deltaテーブルにおけるリキッドクラスタリングの活用 (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/9e2e4a515419c5c805e1


楽観的なトランザクション管理 (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/9e2e4a515419c5c805e1


Databricks 事例(株式会社リクルート)

https://www.databricks.com/sites/default/files/2023-03/customer_story_recruit_ja_jp_2.pdf

Show more...
10 months ago
19 minutes 16 seconds

OTF Talk
#21 Delta Lake 入門

OTF Talk 第21回はDatabricksの桑野 章弘さんに、「Delta Lake 入門」についてお話をうかがいました。


Delta Lakeのはじまり/商用版とOSS版の違い/Delta Lake の特徴/楽観的なトランザクション管理/Unity Catalog


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。

https://www.otftalk.com/


guest:@kuwa_tw

Databricks ソリューションアーキテクト


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

桑野さん Xアカウント https://x.com/kuwa_tw


Databrics https://www.databricks.com/jp


Delta Lakeとは? (Databricksドキュメント)

https://docs.databricks.com/ja/delta/index.html


Delta Lakeクイックスタートガイド (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/345f503d5f8177084f24


Deltaテーブルにおけるリキッドクラスタリングの活用 (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/9e2e4a515419c5c805e1


楽観的なトランザクション管理 (Takaaki Yayoi)

https://qiita.com/taka_yayoi/items/9e2e4a515419c5c805e1


Databricks 事例(株式会社リクルート)

https://www.databricks.com/sites/default/files/2023-03/customer_story_recruit_ja_jp_2.pdf

Show more...
10 months ago
20 minutes 50 seconds

OTF Talk
#20 Apache Hudiを巨大トラフィックのシステムに導入しようと検証して得た知見(後編)

OTF Talk 第20回は、joker1007さんに「Apache Hudiを巨大トラフィックのシステムに導入しようと検証して得た知見(後編)」についてお話をうかがいました。


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


Hudiを選択した背景/検証環境/インデックス設定による変化/結果と考察


guest:@joker1007

Repro チーフアーキテクト


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

joker1007さんXアカウント https://x.com/joker1007

Repro https://repro.io/


更新可能なデータレイクを構築するテーブルフォーマットApache Hudiについて (joker1007さんによるHudi解説)

https://tech.repro.io/entry/2024/07/26/141233


本番のトラフィック量でHudiを検証して見えてきた課題 (otfst_tokyo #4 でのjoker1007さん登壇資料)

https://speakerdeck.com/joker1007/ben-fan-notorahuitukuliang-dehudiwojian-zheng-sitejian-etekitake-ti


Apache HudiのMerge on Readテーブルのパフォーマンス特性とチューニングについて(上記資料の解説ブログ)

https://tech.repro.io/entry/2024/10/28/170721


Show more...
10 months ago
27 minutes 58 seconds

OTF Talk
#19 Apache Hudiを巨大トラフィックのシステムに導入しようと検証して得た知見(前編)

OTF Talk 第19回はjoker1007さんに、「Apache Hudiを巨大トラフィックのシステムに導入しようと検証して得た知見(前編)」についてお話をうかがいました。


既存システムとその特性/将来に向けて解消したい課題/OTF(Hudi)に着目した理由


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


guest:@joker1007

Repro チーフアーキテクト


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考)

joker1007さんXアカウント https://x.com/joker1007

Repro https://repro.io/


更新可能なデータレイクを構築するテーブルフォーマットApache Hudiについて (joker1007さんによるHudi解説)

https://tech.repro.io/entry/2024/07/26/141233


本番のトラフィック量でHudiを検証して見えてきた課題 (otfst_tokyo #4 でのjoker1007さん登壇資料)

https://speakerdeck.com/joker1007/ben-fan-notorahuitukuliang-dehudiwojian-zheng-sitejian-etekitake-ti


Apache HudiのMerge on Readテーブルのパフォーマンス特性とチューニングについて(上記資料の解説ブログ)

https://tech.repro.io/entry/2024/10/28/170721


Show more...
11 months ago
20 minutes 9 seconds

OTF Talk
#18 LINEヤフーにおけるHiveからIcebergへの移行(後編)

第18回:LINEヤフーにおけるHiveからIcebergへの移行(後編)


OTF Talk 第18回は、奥田さんに「LINEヤフーにおけるHiveからIcebergへの移行(後編)」についてお話をうかがいました。


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


Iceberg導入のモチベーション/HiveからIcebergへインプレースでの移行/一部移行した感触/ユーザーコミュニケーションの重要性


guest:奥田 輔さん @okdtsk

LINEヤフー データグループ


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考文献)

Cloudera Evolve 2024

https://www.cloudera.com/events/evolve/singapore.html


LINEのデータプラットフォームが目指すべき未来

※2021年の資料ですが、当時の基盤やデータサイズについて触れられています。

https://speakerdeck.com/line_developers/the-future-of-line-data-platform-we-are-aiming-for


Protocol Buffers

https://github.com/protocolbuffers/protobuf

Show more...
11 months ago
24 minutes 51 seconds

OTF Talk
#17 LINEヤフーにおけるHiveからIcebergへの移行(前編)

OTF Talk 第17回は奥田さんに、「LINEヤフーにおけるHiveからIcebergへの移行(前編)」についてお話をうかがいました。


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


Cloudera Evolve 2024での登壇/HDFSで900PB超のデータ基盤/現状の構成と課題/なぜApache Iceberg?


guest:奥田 輔さん @okdtsk

LINEヤフー データグループ


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考文献)

Cloudera Evolve 2024

https://www.cloudera.com/events/evolve/singapore.html


LINEのデータプラットフォームが目指すべき未来

※2021年の資料ですが、当時の基盤やデータサイズについて触れられています。

https://speakerdeck.com/line_developers/the-future-of-line-data-platform-we-are-aiming-for


Protocol Buffers

https://github.com/protocolbuffers/protobuf


Show more...
11 months ago
21 minutes 14 seconds

OTF Talk
#16 AWS GlueのOTFサポート

OTF Talk 第16回は、鯵坂さんに「AWS Glueの OTFサポート」についてお話をうかがいました。


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


AWS Glue概要/AWS GlueのOTFサポート/開発におけるOTFトピック(Hudi, Iceberg)


guest:鯵坂 明さん @ajis_ka

AWS Glue サービスチーム シニアソフトウェアエンジニア / Hadoop PMC


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考文献)


Apache PMC (Project Management Committee)

https://www.apache.org/dev/pmc.html


Apache Ozone

https://ozone.apache.org/


AWS Glue

https://aws.amazon.com/jp/glue/


Hudiのログメッセージ改善Pull Request

https://github.com/apache/hudi/pull/9577


Icebergのコメント対応Pull Request

https://github.com/apache/iceberg/pull/10199

Show more...
11 months ago
20 minutes 14 seconds

OTF Talk
#15 Apache Hadoopから見たOTF

OTF Talk 第15回は鯵坂さんに、「Apache Hadoopから見たOTF」についてお話をうかがいました。


OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。


鯵坂さんとHadoopとの関わり/OTF環境で利用されるHadoopソフトウェア/OTF実装とHiveカタログ


guest:鯵坂 明さん @ajis_ka

AWS Glue サービスチーム シニアソフトウェアエンジニア / Hadoop PMC


host: @simosako (下佐粉 昭)

AWSのソリューションアーキテクト。 専門はデータレイク 、データウェアハウス。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


※感想は #OTFTalk でポストいただけると励みになります。

※発言は各個人のものであり、所属組織を代表するものではありません。


参考文献)

Apache PMC (Project Management Committee)

https://www.apache.org/dev/pmc.html


Apache Ozone

https://ozone.apache.org/


AWS Glue

https://aws.amazon.com/jp/glue/


Hudiのログメッセージ改善Pull Request

https://github.com/apache/hudi/pull/9577


Icebergのコメント対応Pull Request

https://github.com/apache/iceberg/pull/10199


Show more...
12 months ago
19 minutes 53 seconds

OTF Talk
OTF Talk は、OTF = Open Table Format の技術的な解説や最新トピック等を、ゲストをむかえてお話をうかがうPodcastです。 (host: @simosako) https://www.otftalk.com/