#86 デビッド・シルバー


#86 デビッド・シルバー

デビッド・シルバーは、DeepMind の強化学習研究グループを統率しています。これまでに、AlphaGo 及び AlphaZero の主任研究員、AlphaStar の共同主任研究員、MuZero の主任研究員を務め、強化学習における多くの重要な取り組みを率いてきました。


- 初めて書いたプログラムは?

4:09

- AI に興味を持ったのはいつか?

6:07

- AlphaGo について #1

11:08

- 囲碁のルールについて

21:42

- 強化学習の道に入ったきっかけとその歩みについて

25:37

- 強化学習とは?

30:15

- AlphaGo について #2

43:51

- AlphaGo の教師あり学習と self-play について

53:40

- AlphaGo と対戦したイ・セドルが残した言葉や引退についてどう思うか?

1:06:12

- ガルリ・カスパロフと交わした会話について

1:08:57

- AlphaGo Zero / AlphaZero と self-play について

1:14:10

- AlphaGo Zero / AlphaZero の創造性(人間が定石として知らない新しいパターンを発見する能力)について

1:31:29

- AlphaGo Zero / AlphaZero の異なる分野への応用について

1:35:21

- 報酬関数について

1:37:59

- 人生の意味とは?

1:40:51