#108 セルゲイ・ルビン


#108 セルゲイ・ルビン

セルゲイ・ルビンは、カリフォルニア大学バークレイ校の教授です。認識と制御を結びつけるエンドツーエンドのニューラルネットワークを学習するアルゴリズム、逆強化学習向けのスケーラブルなアルゴリズム、深層強化学習アルゴリズムの開発などに取り組み、ディープラーニング、強化学習、ロボット工学、コンピュータビジョンにおける世界的な研究者です。


- 人間と最先端ロボットの違いとは?

3:05

- ロボット工学のゴールとは?ロボット工学において一般的な大きな問題とは?

16:13

- ビジョンから操作スキルを学習するエンドツーエンド学習について

22:49

- ロボット工学の規範問題について

27:01

- ロボット工学の一般的な問題を解決するには、常識推論が必要だと思うか?

31:44

- ロボット工学の問題は、人間によるルールの実装無しに、純粋に学習により解決できると思うか?

34:41

- 強化学習(model-based / value-based / policy-based、on-policy / off-policy)、深層強化学習について

44:55

- 強化学習の観点から自動運転の問題について考察

1:06:36

- 強化学習におけるシミュレーションの役割とは?

1:08:15

- データから学習できることの限界は?私達は単純にデータから重力を学ぶことができるか?

1:13:46

- self-play について

1:16:03

- 報酬関数について

1:17:39

- AI の脅威について懸念しているか?

1:23:58

- 強化学習の研究を通して、私達自身について学んだことは?

1:25:13

- リチャード・サットンのブログ記事「Bitter lesson」(苦い教訓)について

1:27:01

- 影響を受けた本、AI に興味を持ったきっかけについて

1:29:00

- 機械学習や強化学習をこれから始める学生に対してアドバイスは?

1:32:13

- 人生の意味とは?

1:33:55