现在我们要通过bellman equation来解出王老五会接受颜值多少以上的姑娘。假设王老五在某一时刻 t 开始时是单身的,我们用V表示从这一时刻 t 起,王老五每一时刻都做出最佳选择后一生可以达到的幸福值。 为了简便计算,我们假设王老五的一生很长,无穷无尽,因此 V 是 stationary的,也就是说从任何一个时刻计算V都应该是一个定值。因此我们可以写下下面这个均衡状态的等式:
在等式的左边是在 t 时刻的一生幸福值,而等式的右边将这个分解开来成为两个和。右边第一项 b-v 是 t 时刻作为积极寻找妹子的单身的效用,第二项则是将t+1时刻以后所有的效用贴现。max(V, \frac{y}{1-\beta})代表了老王要在两个选择中决定一个。如果选择了颜值为 y 的妹子,他以后就不用单身了!可以每一个时刻都获得 y 的效用,也就是\sum_{k=0}^{\infty}\beta^k y=\frac{y}{1-\beta} 。而如果他放弃了妹子,下一个时刻开始的时候他依然是单身,余生幸福值是V。老王会选择给他最多幸福感的那个,但是这取决于遇到的妹子颜值 y。于是我们通过积分和概率密度函数求得老王下一时刻可以得到的幸福值的期望。