V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  jifengg  ›  全部回复第 27 页 / 共 54 页
回复总数  1069
1 ... 23  24  25  26  27  28  29  30  31  32 ... 54  
以前公司做过,从零开始的话,就是
建库:搜集大量素材(视频或语音),语音识别(带时间点的),[人工校验],文字分词或分句(分词颗粒度更细),索引入库;
制作:根据文案分词或分句,去库里搜索对应的音视频,合并;加个人工检查的话,就可以对同一个分词多个素材进行筛选,找到最合适的那一个。
@huzhikuizainali
注意你的题干第一句是“已知 5 只动物中有 1 只患有某种疾病”,你的要求是找到它,所以概率不是”抽中的动物会不会患病“,而是”会不会抽中患病的动物“,换个题干也许你会更清晰:

有 5 个外表一模一样的小球,其中一个比其他的重,问怎么筛选能更快的找到这个重球。

因为你抽出来之后,不会再把球放回去了。所以第一个不是的话,第二个抽中这个重球的概率就是 4 选 1 ,也就变成 1/4 ,而不是 1/5 了。

你用骰子来比喻不对,原因就是骰子不能投一次就去掉一面。

总之,你明确知道了有一个重球,那么每次你能不能抽中它,这个概率就不是固定的,会随着你剩余的球越少,概率越高。

至于叫什么名字,抱歉真不知道了。其他方案在计算的时候也是和甲方案一样的。
我上面解答出错的地方:这个题,“有且只有一个患病”是一个前提,那它就不能等同于“每只患病、不患病的概率分别为 0.2 、0.8”,而应该等同于“患病的这一只在第 1 到第 5 个位置的概率均为 0.2”。

这就简单了,患病的在第 1 个位置,那就只做 1 次化验,在第 n 个位置,就需要做 n 次。
概率是:0.2+0.2+0.2+0.2+0.2
期望是:1*0.2+2*0.2+3*0.2+4*0.2+4*0.2 = 2.8 次

上面我基于“每只患病概率是 0.2”推算的错误的“做 2 次化验找到患病”的概率是 0.8 * 0.2 = 0.16 。
因为这题“有且只有一个患病”,所以一旦确定了第 1 个不患病,就剩 4 个,那第 2 个是患病的概率,就是 1/4 ,而不是 1/5 ,所以应该是 4/5 * 1/4 = 1/5 = 0.2 。

同理“做 3 次化验找到患病”的概率是 4/5 * 3/4 * 1/3 = 1/5
不好意思,上面的计算有点问题,等我整理一下重新回复
同理,分成 3-2 两组的话,概率是:
0.6 * ( 0.2 + 0.8*0.2 + 0.8*0.8 ) + 0.4 * ( 0.2 + 0.8 )=1

期望次数就得注意一下,一开始化验小组的次数也要加上,就是:

0.6 * ( ①+ 1*0.2 + 2*0.8*0.2 + 2*0.8*0.8 ) + 0.4 * ( ①+ 1*0.2 +1* 0.8 )=2.48

以上两个 ① 就是化验小组的次数

为什么后面那个小组也是①,因为就两组,不在前面那组就在后面那组,所以都只要①次就能确定病患在哪组。

可能有人想算算分成 2-2-1 三组的话,概率和期望怎么算,我算了一个期望,是 2.6 次。你也可以试试。
概率学还给老师了,回答一个关于概率不等于 1 的问题,如果说错了欢迎指出。

假设 5 只里面有且只有一只患病,每只患病、不患病的概率分别为 0.2 、0.8 ,逐个化验:
第 1 只就检查出的概率是 0.2
第 2 只就检查出的概率是 0.8*0.2 (不是 2/5 ,简单理解就是 第 1 只不是才化验第 2 只,所以是 0.8*0.2 )
3 ---> 0.8*0.8*0.2
4 ---> 0.8*0.8*0.8*0.2
5 ---> 0.8*0.8*0.8*0.8 (因为已经确认有一只,所以只要前 4 只都不是,就肯定是第 5 只,所以这里只需要化验 4 次)

以上概率加起来就是 1
概率和化验次数相乘后相加,就是整个的期望化验次数:
1*0.2+2*0.8*0.2+3*0.8*0.8*0.2+4*0.8^3*0.2+4*0.8^4=2.952
2022-08-10 09:28:33 +08:00
回复了 dtgxx 创建的主题 问与答 数据库选型问题请教各位大佬,大佬们帮帮忙!
我支持 @nomagick 的说法,没看出是选型问题。你所说的“大 json”,是字段多,还是有很多数组之类的数据。需求 2.0 ,完全就是 es 没用好,es 可以只返回指定字段。
另外,你应该不会只用 es 而没有用其他关系型数据库吧?
2022-08-10 09:18:11 +08:00
回复了 wuhanchu 创建的主题 软件 求 多屏 多视频 同步控制播放 方案?
给个思路:
如果是多个安卓设备,且能够打开“USB 调试”,那么可以用一台 windows ( mac ,linux 也行)通过 adb 连接这些设备,通过 adb 命令发送模拟键盘事件或点击事件。如果连 USB 线不方便,可以一台台开启“网络 usb 调试”
2022-08-09 08:56:02 +08:00
回复了 Aloento 创建的主题 设计 我放一张图,然后我什么也不说,你能猜出这是什么吗
太简单了,这不就是******嘛。
2022-08-08 10:11:19 +08:00
回复了 Johnoo 创建的主题 分享创造 弱电箱神器|史上最小巧 X86 架构多网口小主机|硬件资讯
关注一下,同时关注一下价格。
2022-08-05 09:54:15 +08:00
回复了 roaraurora 创建的主题 问与答 有什么个人 UP 主适用的音频转文字方案?
在线的话,可以看腾讯云,每个月有 10 小时免费限额,一般够用。识别结果有 词+时间点的,可以做字幕。
离线的话,可以看看我之前在本站发的一个帖子,需要自己折腾一下。
2022-08-03 10:00:30 +08:00
回复了 wasd6267016 创建的主题 问与答 求助:怎么下载非主流网站的视频流
如果一般的嗅探软件嗅探不到,有可能是.m3u8 文件和视频文件做了“文件头”伪装。我见过几个网站,就是通过伪装成 png 文件的。这样的即使找到原始切片文件,下载后还需要把多余的文件头去掉才能合并成可播放的视频文件。
2022-08-02 10:45:53 +08:00
回复了 particlec 创建的主题 问与答 代码中数组自己变成了对象为什么?
{ ...value, domainId: 1000 }

兄弟,你解构后又重构一个 object ,可不就这样了么
我用的是这个 https://phus.lu/ ,添加 nginx 配置和一个 html 文件即可。无需自行编译 nginx 。也无需 php 等服务端脚本语言。
我自己加了一些功能比如:markdown 更好的预览效果、图片当前页面预览、一键复制全部链接等。
当然这些都是 js 里做的,熟悉 js 的话可以增加任意功能。作者提供了一个基本思路,怎么玩就看自己的。
2022-07-25 14:56:02 +08:00
回复了 Features 创建的主题 问与答 Tokenview。com 这个网站什么时候开始打不开的?
根据网页快照:
https://web.archive.org/web/*/Tokenview.com
最后一次快照是 2022-5-30 号
2022-07-21 13:16:59 +08:00
回复了 Wallace01 创建的主题 问与答 身份证号的 X 是不是一个糟糕的设计?
我还有一个觉得不好的地方,x 是有大小写的,有的系统不忽略大小写,会导致不匹配。
我也是支持用镜像站。多拉几个 iso ,一个可能不能提现你的速度
2022-07-05 13:18:53 +08:00
回复了 A3m0n 创建的主题 问与答 Docker 安装 Adminer 后,通过 Frp 内网穿透后无法打开
“不行”是具体指的啥?
查一下 adminer 的日志,看看是不是来源 ip 限制了,是否 adminer 监听的 ip 是 192.168.xxx ,是的话可以改成 0.0.0.0 试试。
1 ... 23  24  25  26  27  28  29  30  31  32 ... 54  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1190 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 18:46 · PVG 02:46 · LAX 11:46 · JFK 14:46
Developed with CodeLauncher
♥ Do have faith in what you're doing.