【A】5/23登場分(4報)
[2205.10306] Hidden scale invariance in the Gay-Berne model
MD simulationで比較的お手軽に液晶みたいな異方性粒子を扱うのに広く用いられているGay-Berne potentialの相図を調べたらscale invarianceがあったよ,という論文.
potentialのパラメータ領域としては細長い棒状粒子になるくらいの領域を見ている.
reduced unitにしたらdynamicsがきれいにcollapseできてしまうisomorph lineが温度-密度相図上に見つかったという報告をしている.
これは温度-密度相図が実質1次元とみなせることに対応していますね?という結論.
どのくらいuniversalな性質なのか気になりますね.
[2205.09886] Nonequilibrium thermodynamics of the asymmetric Sherrington-Kirkpatrick model
非平衡系のモデル系として非対称SKモデルというものの非平衡熱力学を考えてみる.
(外場が時間依存しているところが非対称性のsource?外場ゼロの場合とかも考えるし,他にもある?)
秩序-無秩序非平衡相転移は観察されるけど,スピングラス相的なdynamicsは観察されないらしい.coupling非対称性が原因ぽい?
エントロピー生成だけじゃ転移点を見誤るかもしれないよということも重要なメッセージになっている.転移点から離れた場所で極大値を取ることもあるらしい.
エントロピーrateというものも一緒に見ると転移点かどうかが見極められるようになると提案している.
著者が著者だけに脳機能的観点での考察も試みているようで興味深い.
[2205.10343] Towards Understanding Grokking: An Effective Theory of Representation Learning
Grokkingという概念があるらしい:overfittingしとるやんけ...と思いながらも何epochも放置してたら汎化し始める現象のことらしい.
機械学習系のconference proceedingsっぽいformatの論文なわけやけど,Introにこの論文の論点となっている問とそれへの答えがまとめてあって非常にありがたかった.
Q1.汎化性能の起源は?:Grokkingが起こるようなときはなにが起きて汎化しとんや?
→A1.対象タスクがパラメータ空間上で”適切な構造”を持っていて,ニューラルネットのrepresentationがそれにたどりついたら汎化性能が現れ得る:図1,2
Q2.臨界訓練サイズ:なんでgrokするため(つまり汎化に転じるため)に必要になる時間はトレーニングセットのサイズが臨界サイズに向けて小さくなるにつれて発散するのか?
→A2.臨界サイズはA1で言及されたrepresentationを決定するのに必要な最小サイズになっているから
Q3.汎化の遅れ:どういう条件下でGrokkingが起きるのか?
→A3.Grokkingはただの丸暗記とデータ構造の理解の間の相で,hyperparameterのtuningで回避可能でもあるらしい.
興味深い.
なんだかガラス転移っぽさもあるし吉野さんのRSBの研究との関係も気になったけどここでのGrokkingはそういうことではなさそうか?
これもなんかのConference proceedings風format?
割とのっけからSymplectic多様体の話がある.結構数学寄りの話のような感じが強いか?
タイトルから予想されるmotivationは面白そう.
ちなみに『第一弾:幾何学的視点』みたいなタイトルやけど,むしろ幾何学以外の視点でも幾何学の影響を考えてみる予定なのだろうか?
続編が気になるところです.