围棋之神隐退江湖

随着 AlphaGo 大胜柯洁,我想围棋这个曾经被认为是 AI 短板的智力游戏已经不再成为一个问题。不过似乎从哲学上来看,这个问题远远没有被解决。通常的棋类博弈都可以看成一个 graph 上的搜索问题,棋盘的状态对应图的顶点,而棋手选择的 move 作为连接两个顶点的边。对于象棋之类的,合法的移动较少(每个类型的子都会有不同的约束),棋盘也比较小,在往常博弈的过程中简单的评价方式已经比较准确的反应了每种子的重要程度,因此可以比较容易根据己方对方剩余棋子的价值来评估每一个 move 之后的损失或者收益。而常见的搜索方法也就是在图上进行“有限”深度的遍历,寻求一条“理性”博弈后己方收益最大的路径。

这种人类理性思维的延拓以及程序实现成为了早期 AI 的基本原理。但是很显然面对围棋这种棋子无差异,棋盘巨大,最终也并不是按照某颗子是否存活断定输赢的游戏,它导致了两个传统算法的核心问题:

  • 搜索空间过于巨大,如果不进行有效的剪枝,是不可能在有限的比赛时间里完成有意义的搜索工作的
  • 评估本身的困难,如果看职业棋手的评估,往往也只出现在某些局部逐步的明朗后,根据规则计数才成为可能,而对于早期的评估基本上没有太大的意义

本质上 AlphaGo 的成功也正是寻找到了对于这两个问题的解决方案。然而实际上这种方案的出现仍然植根于职业棋手的思维方式。与一般的棋类活动不同的是,围棋选手通常用比较“虚”的东西来描述棋局的优劣,这些东西往往来自他们过去的经验,有的可以定量化,更多的似乎是“直觉”。AlphaGo 比较有意思的做法大概也就在于使用 deep learning 这套“玄学”来复制人类的“玄学”吧。

比较有意思的大概是人类棋手对于 AlphaGo 的认知。他们经常会用情感色彩的东西来描述这个高深莫测的对手,从“棋力”的角度来看,人类在短短几小时里能够推演出来的 variations 与计算机相比还是少了太多太多,因此输棋几乎已经是必然。人类的唯一希望只是在于对于“价值”的评估上,李世石唯一赢得的那局也是因为这个;但是现在的 AlphaGo 通过自我博弈探索自己的弱点修正了“评估”上的“瑕疵”(或者还有别的瑕疵,这大概也是 DeepMind 为何年初 60 大胜之后还要再来寻找柯洁比试一次)。其实如果说 DeepMind 真希望做一次更为合理的比试的话,应该给棋手看到 AlphaGo 的评估网络的输出,这才是人类真正能够发挥自己优势的地方。至于那 50 局的棋谱怕是杯水车薪反而误导职业选手了吧。

最后说一点关于围棋本身的哲学。评判输赢在于最终占有目数多少却不在于多多少目,这与 SVM 当年给人的感觉何曾相似,与常见的最大似然不同,要的仅仅是两类的 margin。目标函数的选择往往是哲学上的区别,而哲学的区别表现为行为方式的不同,造成理解上的隔阂。不少人抱怨 AlphaGo 在收官的阶段通常下一些不那么犀利的行棋方式,特别 pair match 时落后一方古力配对的 AlphaGo 甚至被认为在自杀,其实理解了哲学上的区别就很容易理解。收官阶段很多棋尽管仍然有一定的活动空间,但是前期的差距基本已经定型,如果 AlphaGo 已经计算出来无论怎么折腾它有应对的策略,即便损失一定的优势,但是避免了更加激进策略下可能翻盘的可能性,那么选择更为稳妥的落子当然是不违背本身的哲学的;在已经知道必输无疑的情况下,避免使用激进的策略无非也是出于同一哲学思想。

人在与人的博弈策略的转换是一个额外的因素。不是每一个人在针对不同对手的时候都会使用相同的策略的。哲学决定了目标函数,策略只是实现哲学的手段。人类能够透过策略看到哲学,进而把握对方根基上的弱点而调整自己的哲学与其相抗衡。对于简单的棋局,也许只有唯一合适的哲学。有没有一个问题本身是不存在最优哲学而要求参与者必须转换自己的策略来增强自己的胜算的呢?石头剪刀布?还是说任何问题都一定存在一个最优的目标函数,只是我们无法 formulate 出来。

围棋之神隐退江湖

永久的话题 love

最近看了好几部影片,本来似乎很零散,事后整理的时候发现其实每部影片都有一个共性,尽管大家叙述的方式不一样,论述的角度也不一样,但是都在探讨一个永久的话题,love。

Once 是一部小成本爱尔兰电影,非常喜欢,也是一部音乐电影,里面的男女主角甚至没有名字,最后字幕里面简单的写着 guy 和 girl。整部片子感觉全部就用手持摄像机拍摄,色彩并不像很多大片讲究纯粹,影调多数情况都是比较昏暗,场景基本就是人流熙攘的街头,杂乱的家,即便去海边短暂的 dating,也是阴天,直到最后我们才看见温暖的阳光。sg 出场白天在街头卖唱,晚上无人施舍他一个人大声的唱道,

And I don’t understand,
when you reached out my hand,
And if you have something to say,
You’d better say it now.
‘Cause this is what you’ve been waited for
Your chance to even up the score
And as the shadows fall
On me now I’ll win somehow
Yeah~
‘Cause I am picking a message, Lord
That I’m closer than I’ve been before
So if you have something to say
Say it to me now
Just say it to me now, now

(Glen Hansard: Say it to me now)

一阵高昂过后 mn 抱着一堆向人兜售的 Big Issue 向 sg 的包包里面扔了 10 cents,这就是上帝传达的 message 么?mn 很快就说白天看你在这里唱,晚上唱的却没听过,一番 ds 后 mn 说道 hoover fixer sg,帮我修 hoover 吧~

片子剪得很短,衔接却毫不松懈,下一个场景就是 sg 在家一个人唱着歌想着 ex,这也解释了 sg 唱得都很偏分手歌曲的事实

You have broken me, all the way down
Down upon my knees

(and) You have broken me, all the way now
You’ll be the last, you’ll see

(and) Some fight you gave
When I pushed you away
From me

(and) In the morning
When you turn in
I’ll be far to sea

(and) You have broken me, all the way down
You’ll be the last, you’ll see

(and) What chance have we got
When you missed every shot
From me

(and) In the morning
When you turn in
I’ll be out of reach

(and) In the darkness
When you find this
I’ll be far to sea

(and) You have broken me, all the way down
You’ll be the last, you’ll see

(Glen Hansard: All the way down)

事实上,我觉得这首歌更像后来 sg 离开去伦敦的感觉。歌曲穿插到下一个场景 sg 白天继续卖唱,mn 如约而至拖着胖胖的 hoover,然后 mn 趁机和 sg 去吃了个午饭,sg 对 mn 的钢琴产生了兴趣,于是一同去一家器材店,mn 试奏一首门德尔松的钢琴曲(是啥?)之后,二人合奏了一曲非常好听的 falling slowly,歌词里面唱道

I don’t know you
But I want you
All the more for that

Words fall through me
And always fool me
And I can’t react

正是两人偶然相识。后来回家修 hoover 之后去 sg 寝室听音乐后,sg lonely 过度直接邀请 mn住宿一宿,mn 不快而离去。

sg 有些后悔第二天到街上找到卖花的 mn,试图解释清楚请求原谅,同时借给 mn CD 用于听听自己创作的音乐,当晚陪 mn 回家吃了顿饭后回去。

mn 准备为 sg 一无词曲填词,这就是另外首好听的 if you want me,昏暗的街头,CD 没电了投了小女儿的零花钱出来买电池,迫不及待重新让 CD 播放,喝着弦律,刚走出门的 mn 轻轻地哼着,

Are you really here
or am I dreaming
I can’t tell dreams from truth

mn 走着后面的人似乎侧着耳朵想听清楚这优美的歌声在诉说什么。对面的车灯打过来,mn 漂亮的脸蛋洋溢着一种幸福。mn 开始第二天的工作,去人家家里面打扫清洁,而 sg 开始创作 Lies,通过他自己的 laptop 画面从侧面展示了他和 ex 的过去种种,几经调整,终于成曲

I think it’s time, we give it up
And figure out what’s stopping us
From breathing easy, and talking straight
The way is clear if you’re ready now
The volunteer is slowing down
And taking time to save himself

The little cracks they escalated
And before we knew it was too late
For making circles and telling lies

You’re moving too fast for me
And I can’t keep up with you

Maybe if you slowed down for me
I could see you’re only telling
Lies, lies, lies
Breaking us down with your
Lies, lies, lies
When will you learn

The little cracks they escalated
And before you know it is too late
For making circles and telling lies

You’re moving too fast for me
And I can’t keep up with you
Maybe if you’d slowed down for me
I could see you’re only telling
Lies, lies, lies
Breaking us down with your
Lies, lies, lies
When will you learn

So plant the thought and watch it grow
Wind it up and let it go

(Glen Hansard: Lies)

镜头一转又回到 sgmn 见面的街头,sg 说我要去伦敦了,但是走前想录制些歌曲希望 mn 能伴奏伴唱,mn 欣然答应,去询问了录音室需要 2k,于是去贷款,贷款人也很喜欢音乐于是敲定,在街头选中了另外的吉他手、贝司手、鼓手,临时的乐队就这么拼凑了出来。这段里面有两人去参加这伙人晚上聚会,挤在一张桌前,共一口碗,吃得津津有味。

次日一早,sg 偷来 bb 的摩托带 mn 出去兜风,一早上 mn 看见 sg pdpd 的跑过去的样子很可爱,mn 走路踏出去一步很快,踩下后总觉得没站稳,所以走快了就 pdpd 了。sg 了解到 mn 已婚,但是和丈夫不和,带着小朋友和老母住了出来,家里面穷就靠 mn 每天在街上买点花、杂志,去人家里面打扫,生活艰辛略见一斑。在海边,sg 学者捷克话问 mn,你爱你老公么?mn 用 sg 听不懂的捷克语回了一句,sg 摸不着头脑。

后面很快就开始训练(Try to pull myself away),并且时间紧迫的他们进入了录音棚和录音师开始合作他们的唱片,一首 when your mind’s made up,让录音师刮目相看,

So, if you want something
And you call, call
Then I’ll come running
To fight, and I’ll be at your door
When there’s something worth running for

When your mind’s made up
When your mind’s made up
There’s no point trying to change it
When your mind’s made up
When your mind’s made up
There’s no point trying to stop it

You see, you’re just like everyone
When the shit falls all you want to do is run, away
And hide all by yourself
When you’re far from me, there’s nothing else

When your mind’s made up
When your mind’s made up
There’s no point trying to change it
When your mind’s made up
When your mind’s made up
There’s no point even talking
When your mind’s made up
When your mind’s made up
There’s no point trying to fight it

So, if you ever want something
And you call, call
Then I’ll come running.

劳累的周末,最终曲终人散,和伙伴们道别。唯一一次 bb,在工作间隙,mn 弹奏着 The Hill,之后抱怨着丈夫对自己的不理解,sg 说跟我去伦敦吧,两人 yy 一会,突然 mn 说可以带我妈去么,然后嘎然而止。

在回家的路上,mn 要和 sg 分道扬镳了,sg 说去我家坐坐吧,mn 说去了就是 hanky panky 比较 worthless,丈夫打电话过来了说要来看看,不管 sg 怎么邀请,最后 sg 在家空等候了一天,mn 始终没有出现。第二天 sg 跟老父告别,打电话通知 ex 即将到伦敦,去看望 mn 却不在家,最后来到了第一次他们合奏的乐器店,凝视着那架钢琴。前往伦敦的路上只有 sg 自己,mn 清早起来门前送来那架钢琴,暖暖的阳光撒进 mn 原本昏暗的家中,mn 停下了弹奏注视着远方。

一开始觉得 mn 真的很绝,从两人的关系慢慢亲密到最后突然消失,直到最后获知在海边 mn 对 sg 说的那句捷克语是“我爱的是你”,once 爱你一次,亦即曾经,背景演奏的还是那首 falling slowly

Take this sinking boat and point it home
We’ve still got time
Raise your hopeful voice you had a choice
You’ve made it now
Falling slowly sing your melody
I’ll sing along

sg 其实知道自己去 London 可能并不是在纯粹为了 get ex back,mn 也知道自己曾经是那么的深爱 sg。相信这短暂的几天,对两人的一生都会是刻骨铭心。

另外一部 95 年的爱情喜剧片 French Kiss 就没有这么让人乐于回味的一种感觉。里面 Kate 对丈夫出轨之后所做的(I will get him back, I will triumph,背景是凯旋门 Orz),却让他慢慢认识到了对丈夫的爱是不值得的,相反那个小偷 Lux 却因为对自己葡萄酒庄园的那种热爱让她觉得更加亲密,她把自己的私房钱(21 岁就开始攒钱了 @@)拿出来当作 Lux 买赃物的款项让他能够开始追逐自己的梦想,而 Lux 实现了她爱情的梦想。不过里面对话还是很雷的 -,-b

Lolita 是一个俄罗斯犹太人写的小说改编的电影,97 年版本比起 Kubrick 的据说更加接近原著。中年男人 Humbert 由于年幼时女友早逝一直郁郁寡欢,“爱”上了房东 12 岁的女儿,阴差阳错和房东结了婚之后房东被车撞死,他就正式开始和女儿进行交往,这看来就是 sex 和 money 的交易,因为 Lolita 从来就没爱过他,而是在戏弄 Humbert,难以想象的是这么小的小孩就… 当然,当 Lolita 悄然离开 3 年后一封信向 Humbert 要钱的时候,Humbert 才真正的从原来那种欲望的满足上升华到了另一种感情,他问已不再如昨日娇艳的 Lolita 是否愿意跟他走,Lolita 却问他开个房给钱如何,伤心的 Humbert 扔下准备好的 4k,转身去杀死了最初勾引 Lolita 的恋童癖。整部影片非常的压抑,一股变态的感觉… 也许站在山头等待着警察来抓捕的 Humbert 念叨那群孩子欢声笑语中不再有 Lolita 的时候,他真正的开始爱 Lolita 了。

最后一部可能也是争议最大的片子,Spielberg 的 AI。这里面最集中的问题是,爱是什么,机器人是否能拥有爱(爱是不是可以程序化的?),人是否会回应机器人的爱(程序化的爱能否和人的爱交互,看起来和Turing testing 类似)。这个传闻 Kubrick 构思却未完成的影片,似乎在讽刺人类的爱。人类需要爱:给予和接受,比如里面的 David 是为了让母亲能够给予母爱,Joe 是为了让人获得 sex 情欲的满足而设计。

影片似乎在讽刺人类,爱,不要标榜的那么高尚,就是一种人类自私的活动,而不是人类自己所吹捧的那么无私。David 的人类妈妈的孩子好起来后,最终抛弃了 David,因为并非族类其心必异,加上机器人终究是机器人,似乎就是比人要低等啊,即使它爱她,依照人类的程序来爱,却终究获得不了人类的爱,人可以抛弃他们,可以残忍的破坏他们。

如果说爱能够进行区分,所谓纯粹精神的和纯粹肉体上的,比如 Humbert 可以认为从纯粹的肉体感觉到分开后逐步成熟形成一种精神上的爱。Once 里面却是非常偏重精神的;French kiss 里面 Kate 比较偏重精神,而Julliette 似乎偏肉体(郁闷了找个男人聊天最后就去 ml 了,感觉欧美这种人很多?法国人尤喜好?)那么比如 David 的母亲难道因为母爱没有给予对象,David 的存在成为一个受体,满足了偏肉体的一部分,精神上的爱其实并没有过多的建立起来。感觉 AI 实现了物质上很多东西,精神上的到现在为止还没有感觉,但是是不是物质性规律多了就会产生精神的东西谁也不知道(还是唯物唯心)。当某人自己的小孩满足了作为母亲的施爱欲后,David 的功能迅速消退,对人没用的东西就会被遗弃… 我觉得虽说机器人是从物质上设计出来的,还是能在和人的交互中让人感受到精神上的东西,但是这部分是人自己想象出来的,就跟人看见一组同心圆里面面的直线觉得弯曲了类似,物理上的感受最终被脑处理后得到了不同的暗示,因此人想通过程序产生精神上的爱似乎有点自欺欺人。

问题是我们无法定义什么叫精神上的爱,甚至没办法量化,虽然有一个所谓的柏拉图式 xxx 但是其实到现在我们既不能证明它真实存在也不能否认它的存在。如果说 AI 能实现的话,现在应该局限在物质上的一部分。那么当一个机器人拥有了相当的物质爱或者被爱的能力后,人类有没有做好准备去爱这样一个机器人呢?如果精神这部分也能做出来呢?

永久的话题 love