卢克生日那天,汉来找卢克玩扑克牌,玩着玩着汉觉得太没意思了,于是决定给卢克一个考验
汉把一副扑克牌(54张)随机洗匀,倒扣着放成一摞。然后卢克从上往下一次翻开每张牌,每翻开一张黑桃,红桃,梅花或方块,就把它放到对应的花色的堆里去。汉想问问卢克,得到A张黑桃,B张红桃,C张梅花,D张方块需要翻开的牌的张数的期望值E是多少特殊的,如果翻开的牌是大小王,那么卢克可以把它作为某种花色的牌放入对应堆中。卢克会采取最优策略,使得放入之后E的值尽可能的小显然卢克靠原力的感知可以无视这个问题,汉为给卢克丢了一个没意义的问题而懊恼,于是决定把问题丢给还是绝地学徒的你虽然你并不能善用原力,但是好在你会c++,于是你可以靠程序解决这个问题。卢克和汉还在玩牌,所以你可以在计算出结果后直接将答案汇报给他们0<=A,B,C,D<=15 四舍五入保留三位小数输出f[a,b,c,d,x,y]表示黑桃取了a张,红桃取了b张,梅花取了c张,方块取了d张,小王状态为x,大王状态为y时的期望值
具体来说,x = 4表示没有用过小王,x = 0~3表示用过小王,且把小王作为对应的花色(0代表黑桃,1代表红桃,2代表梅花,3代表方块)可以知道的是,随着翻开的牌数的增加,得到某种花色的概率是在变化的。当前已经翻开的牌总数sum = (a + b + c + d + (x == 4) + (y == 4))。到目前为止,还剩下54-sum张牌,其中13-a张黑桃,13-b张红桃,13-c张梅花,13-d张方块以黑桃为例: 翻开一张黑桃的概率为(13 - a)/(54 - sum)。还需要翻开的牌的期望张数为f[a+1,b,c,d,x,y]。对于红桃,梅花,方块,情况类似特别地,当x = 4时,有1/(54 - sum)的概率翻开小王。根据题意,应选择把小王看做某种花色,是期望值尽量小,即min{f[a,b,c,d,x',y]}(0<=x'<=3).对于大王,情况类似对于大王,情况类似方程显然且省略,建议直接看代码
初值:若已经翻开的牌数达到了题目要求的数量,则期望值位0.例如已经翻开的黑桃张数为a+(x==0)+(y==0),其余同理
目标f[0,0,0,0,4,4]在数学期望递推,数学期望Dp中,通常把终止状态作为初值,把起始状作为目标状态,倒着进行计算。
原因:以本题为例: 根据数学期望的定义,若我们正着计算,则还需求出从起始状态到达每个终止状态的概率,与F值相乘求和才能得到答案,增加了难度,且易出错 而倒着计算,因为起始状态F[0,0,0,0,4,4]唯一,所以它的概率一定为1,最后直接输出f[0,0,0,0,4,4]即为所求
1 #include2 using namespace std; 3 int A, B, C, D; 4 double f[15][15][15][15][5][5]; 5 bool vis[15][15][15][15][5][5]; 6 7 8 inline int read() { 9 int x = 0, y = 1;10 char ch = getchar();11 while(!isdigit(ch)) {12 if(ch == '-') y = -1;13 ch = getchar();14 }15 while(isdigit(ch)) {16 x = (x << 1) + (x << 3) + ch - '0';17 ch = getchar();18 }19 return x * y;20 }21 22 double Dp_to_make_ans(int a, int b, int c, int d, int p, int q) {23 if(vis[a][b][c][d][p][q]) return f[a][b][c][d][p][q];24 vis[a][b][c][d][p][q] = 1;25 int h = a, j = b, k = c, l = d;26 if(p == 0) h++; if(p == 1) j++; if(p == 2) k++; if(p == 3) l++;27 if(q == 0) h++; if(q == 1) j++; if(q == 2) k++; if(q == 3) l++;28 if(h >= A && j >= B && k >= C && l >= D) return f[a][b][c][d][p][q] = 0;29 int sum = h + j + k + l;30 double f_ans = 1;31 if(a < 13) f_ans += Dp_to_make_ans(a + 1, b, c, d, p, q) * (13 - a) / (54 - sum);32 if(b < 13) f_ans += Dp_to_make_ans(a, b + 1, c, d, p, q) * (13 - b) / (54 - sum);33 if(c < 13) f_ans += Dp_to_make_ans(a, b, c + 1, d, p, q) * (13 - c) / (54 - sum); 34 if(d < 13) f_ans += Dp_to_make_ans(a, b, c, d + 1, p, q) * (13 - d) / (54 - sum);35 double shiki;36 if(p == 4) {37 shiki = 100002;38 for(int i = 0; i <= 3; ++i) shiki = min(shiki, Dp_to_make_ans(a, b, c, d, i, q));39 f_ans = f_ans + shiki / (54 - sum);40 }41 if(q == 4) {42 shiki = 100002;43 for(int i = 0; i <= 3; ++i) shiki = min(shiki, Dp_to_make_ans(a, b, c, d, p, i));44 f_ans = f_ans + shiki / (54 - sum);45 }46 return f[a][b][c][d][p][q] = f_ans;47 }48 49 int main() {50 // freopen("test.in", "r", stdin);51 // freopen("test.out", "w", stdout);52 A = read(), B = read(), C = read(), D = read();53 double ans = Dp_to_make_ans(0, 0, 0, 0, 4, 4);54 if(ans > 54) ans = -1;55 printf("%0.3lf", ans);56 return 0;57 }