KDD2022出張記

はじめに

会場のWalter E. Washington Convention Center

この度、KDD2022 (28th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining) のResearch Trackに、下記の論文が採択されました。

Hiroshi Takahashi, Tomoharu Iwata, Atsutoshi Kumagai, Sekitoshi Kanai, Masanori Yamada, Yuuki Yamanaka, Hisashi Kashima,  
Learning Optimal Priors for Task-Invariant Representations in Variational Autoencoders,  
KDD, 2022.  

https://dl.acm.org/doi/10.1145/3534678.3539291

一言で説明すると、「異なるタスクをまたいで普遍的な表現を獲得するVariational Autoencoder」を提案した論文となります。この論文の発表のため、2022/8/14-18にワシントンD.C.で開催されていたKDD2022に参加してきました。私にとって初のコロナ禍での海外出張となったのですが、色々と貴重な経験が出来たので、文章に残しておこうと思います。

KDD2022について

KDDデータマイニング分野におけるトップカンファレンスで、研究寄りのResearch Trackと、実用寄りのApplied Data Science Trackが併設されています。今年のResearch Trackの採択率は約15.0%でした。私は普段ML・AI系の会議に投稿しているのですが、それらと比べてもさらに厳しい採択率だなという印象を受けました*1。また、KDD の特徴として、KDD Cupという世界最大のデータ分析大会が併設されています。今年はAmazonによるAmazon Product Searchというコンテストと、BaiduによるWind Power Forecastというコンテストが開催されていました。

今年は3年ぶりとなる物理開催で、開催地はワシントンD.C.になりました。発表者は原則として現地参加が求められていて、国の政策などの影響で参加できない方のために、限定的なvirtual componentが用意されている、とのことでした*2

渡航・帰国準備

まず最初に、コロナ禍における海外出張の煩雑さについて書いていきたいと思います。平時であれば飛行機とホテルを手配し、海外旅行保険に加入し、パスポートを用意してESTAを申請すればOKなのですが、コロナ禍ではこれらに加えてアメリカ入国・日本帰国時に必要な手続きがあります。

アメリカ入国

2022年8月時点では、アメリカ入国時に下記の3点の書類を提出する必要がありました。

  1. ワクチン接種証明書 (海外用及び日本国内用)
  2. 米国CDCへの宣誓書
  3. 米国CDCへの情報提供書類

実際には上記の書類を揃え、航空会社に事前に提出する形になります。私はANAで飛行機を手配したので、ANA Travel Readyを用いて事前に登録しました。

さて、宣誓書と情報提供書類はすぐに準備できるので良いのですが、問題はワクチン接種証明書です。マイナンバーカードがあれば新型コロナワクチン接種証明書アプリを用いてすぐに発行できるのですが、私はマイナンバーカードを持っていませんでした。その場合は自治体に紙での発行を依頼するのですが、私が住んでいるところでは、郵送での申請で、かつ「申請書類の受理から証明書の交付まで1週間~10日間程の時間を要します。」とのことでした。

私がこの事実に気づいたのが出発10日前だったので、正直かなり焦りました。自治体に電話して事情を説明したところ、「いつまでに送ってほしいかのメモを同封し、返信用の封筒に速達料金の切手を追加で貼り付けた上で、書類一式を速達で送ってほしい」とおっしゃっていただき、そのとおり対応したところ、出発前に証明書を受け取ることができました。自治体の方には大変感謝しています。

実はこの申請に先駆けてマイナンバーカードの申請も行っていたのですが、奇跡的に出発までに発行完了し、アプリの方でも証明書を発行することができました*3

出張前で立て込んでるときに証明書の発行で10日間も待つのは本当にしんどいので、マイナンバーカードを事前に申請しておくことを強くおすすめします。今なら最大2万円分のマイナポイントがもらえるキャンペーンがやっているので、この機会に申請してはいかがでしょうか*4

日本帰国

日本帰国時には、My SOSというアプリを用いてWEB上で検疫手続きを済ませるファストトラックが便利です。 2022年8月時点では、下記の4点の書類を提出する必要があります。

  1. 質問票
  2. 誓約書
  3. ワクチン接種証明書
  4. 出国前72時間以内の検査証明書

質問票と誓約書はMy SOS上のアンケートフォームに答えるだけでOKなので、実際に用意する必要があるののは「ワクチン接種証明書」と「出国前72時間以内の検査証明書」の2点となります。前者は準備が済んでいるので、重要なのは後者です。ようするに現地でPCR検査を受けて、陰性証明書を発行してもらう必要があります*5

これが本当に怖くて、検査結果が陽性だった場合に日本に帰ってこれません。とにかく検査日まではマスクを外さないように気をつけ、検査に臨んだところ、無事陰性となったため、かなり気が楽になりました*6

8/26追記: 陰性証明は9/7から不要になる見通しとのことです。 www3.nhk.or.jp

My SOS上での申請を終えると、My SOSの画面が赤から青になり、それを検疫で見せればOK、という感じでした。色々と手間取りましたが、無事帰ってこれたので本当にほっとしています。

自身の発表に関する所感

さて、ここからはKDDに参加した感想を書いていきたいと思います。私のスケジュールは

  • 8/16 (18:00-19:30) : ポスター発表
  • 8/18 (13:30-15:30) : オーラル発表

というものでした。実は事前の調整に失敗してしまい、ポスター発表の1時間半前に現地の空港に到着するというスケジュールとなってしまいました*7。空港での移動と検疫は1時間以内に済み、すぐさまタクシーに飛び乗って現地に行ったのですが、結果として少しだけ遅れてしまいました。余談ですが、KDDでは参加受付を毎日17時ごろまで行っていて、私が到着したのは18時ごろだったので、バッジ(参加証)をもらっていない状態でした。この状態でポスター会場に行こうとしたところ「バッジが無いよ!」と怒られて入場することができませんでした。当たり前ですね。事情を説明して各所に確認していただき、無事入ることができました。皆様におかれましては、発表される際は時間に余裕を持って会場に行かれるのが良いかと思います。

急いでポスターを設置した時の写真がこちらになります。

ポスター
設置したあとに周りを見回して気づいたのですが、私の発表は機械学習寄りでかなり浮いているなという感じがしました。それでも何名か聞きに来てくれたので、とても嬉しかったです。

オーラル発表の会場はこのような感じでした*8

オーラル会場
正直自分の発表の時はあまり人がいなかったのですが、発表後に式変形について熱心に聞きに来てくれた人がいたので、とても嬉しかったです。議論が盛り上がったおかげで、気づいたら直後のクロージングがすっかり終わってしまっていました。

総じて、かなり無理矢理なスケジュールだったのですが、無事に発表することが出来て本当に良かったです。

KDD Cupに関する所感

続いて、KDD Cupについて書いていきたいと思います。私が所属しているNTTドコモでは、有志がAmazon Product Searchに参加しており、9位入賞されたとのことでした。本当にすごい。その方達は残念ながら現地参加できなかったとのことで、代わりに私が聴講してきました。

KDD Cup 9位入賞

Amazon Product Searchでは、クエリと検索結果のリストと、関連性を示すESCI (Exact, Substitute, Complement, Irrelevant) という指標が提供されているとのことです。クエリと結果は英語、日本語、スペイン語などで提供されています。これらのデータセットを使って、Amazonの商品検索の改善に直結するような3つのタスクを解くのが、本コンテストの目的となっています。各タスクごとにランキングが発表され、ドコモはタスク3での入賞となりました。

statを見たところ、参加者数、結果ともに中国の存在感が非常に大きいという印象を受けました。

国別のKDD Cup参加者
優勝チーム
day-day-upという中国のチームがタスク1で3位、タスク2・3で1位を取っており、そのチームのSolutionを見たのですが、ざっくりいうとInfoXLMというクロスリンガルなモデルを用いて特徴抽出し、LightGBMに突っ込むという感じでした。他のチームもTransformerに突っ込んでLightGBMが多かったので、テキストの処理はこの形式が主流なのかなという印象を持ちました。

私は普段アルゴリズムの研究をしているので、実際の問題へのアプローチを聞くのは新鮮で楽しかったです。とても勉強になりました。

全体に関する所感

ここからは全体の印象について話をしていきます。

雰囲気

久しぶりの物理開催となったKDDですが、コロナ前の学会の雰囲気に戻りつつあるという印象を持ちました。会場内はマスク必須なので皆マスクをしていますが、ポスターセッションもオーラルセッションも盛況でしたし、会場内では食事や飲み物が提供されていました。

ポスター会場
食事の提供
飲み物の提供
keynote

写真で見るとやはりまだ人が少ない印象は受けますが、今後も物理開催の流れは続くでしょうし、徐々に人の数も戻ってくるのではないかと思っています。

発表の傾向

私が普段参加しているML・AI系の会議と比べて、実用寄りの問題設定が多いように感じました。私は普段は実用とは遠いところで研究しているので、実課題に近いところでの発表が多いKDDはとても新鮮でした。分野としてはグラフや広告・推薦に関する発表が多いように感じましたが、非常に幅広い分野がカバーされていました。

8/26追記: Research Trackの発表についてWordCloudと頻出単語上位25位を出してみました。

WordCloud for KDD2022 Research Track Presentations

Top 25 Words for KDD2022 Research Track Presentations

やはりグラフの存在感が強いですね。推薦や公平性も多めです。TransformerやContrastive Learning、Federated LearningといったML系で最近流行りのトピックも、同じように流行っている印象を受けます。

日本人の参加率

一番驚いたのが日本人の参加率の高さです。日本は他国と比べて水際対策が厳しいこともあり、参加を認める組織は少ないだろうと思っていました。しかし、いざ現地に行ってみると、多くの日本人の方が発表や聴講で参加されていました。私が直接会っただけでも20名以上の方がいましたし、名刺だけでもは10枚ほど貰いました*9

色々な方とお話させて頂いたのですが、企業の方々は各々が抱えている課題を明確にした上で、それを解決したり、解決するための糸口を探そうとしている印象を受けました。私は普段アルゴリズムのことしか考えていないので、非常に勉強になりました。大学の方は本当に優秀な方が多く、とても眩しかったです。

私は海外が不慣れなこともあり、現地ではかなりナーバスになっていたのですが、日本人の方が食事に誘ってくれたおかげで、かなりメンタルが回復しました。極めつけには帰りの空港へのタクシーまでご一緒させていただきました。現地で会った皆様、本当にありがとうございました。

その他

食事

初日にコンビニでサンドイッチを買いましたが、高い割に美味しくなかったです。それ以降はほぼすべてマクドナルドで済ませました。マクドナルドだけが日本人を救ってくれます。安くて変わらない味、最高です。最終日は日本人の方に誘っていただき、日本食のレストランに行きました。美味しかったです。

飲み物はお店で水を買って済ませました。滞在2日目に24時間営業のスーパーに連れて行って頂き、そこでevianを大量に買ってしのぎました。

観光

空き時間でワシントン記念塔と国際スパイ博物館、ナショナル・ギャラリーに行きました。

ワシントン記念塔
国際スパイ博物館
ナショナル・ギャラリー

特にナショナル・ギャラリーは無料なのに非常に見応えがありました。一つ気になったのは、警備の方に「リュックは片方だけで背負うように」という指示を受けました。なんでですかね?

もう少し時間があったら色々と見て回れたのですが、またの機会に取っておこうと思います。

まとめ

コロナ禍での物理開催となったKDD2022ですが、非常に活気のあるものとなっていました。私も行くまでは色々と心配だったのですが、いざ行ってみると色々と刺激になることが多く、とても楽しかったです。

今後も物理開催が増えていくと思うので、積極的に参加できるように頑張っていきたいと思います。

*1:ML系の会議の採択率は20%前後のことが多いです。AI系もそのくらいですが、たまにすごく低くなります。

*2:結局virtual componentが何なのかよくわからなかったのですが、私が参加したセッションでは発表者不在でビデオを流している発表があったので、これのことなのかなと思います。

*3:こちらも自治体の方に個別対応していただきました。本当にありがとうございます。

*4:ちなみに私はマイナポイントをPayPayに付与して、飛行機用にノイズキャンセリングヘッドホンを買いました。

*5: 厚生労働省のホームページに様式があるので、印刷して検査機関に持っていき、記入していただくのが良いと思います。

*6:検査結果は1時間以内に出ました。

*7:旅行会社の方が他の便も提案してくれたのですが、どうしても直行便にしたくてこのようなスケジュールとなりました。

*8:カメラのリモート撮影を使って自分が発表しているところを撮ろうとしたのですが、うまくいきませんでした。

*9:名刺交換という文化をすっかり忘れていて、持ってくるのを失念していました。みんなちゃんと社会人してる。