章节目录 第757章 流形学习(1 / 2)
作品:《学霸的军工科研系统》姚梦娜提出的这个问题,对于常浩南来说,不难理解。
只是很难解决。
真要说起来的话,这涉及到文本挖掘、数据可视化、信息检索、数据挖掘、机器学习乃至人工智能等一系列问题。
如果真做到姚梦娜所设想的那样全自动化生产,那就是工业4.0了。
在1999年这个时间点上,显然不大现实。
但不可能完全实现这一整套东西,并不意味着其中没有可以作为突破口的部分。
比如数据挖掘和信息检索,就是千禧年附近很火热的研究方向。
这就导致如今他脑子里空有一大堆名词,但却不知道哪是破局的关键――
常浩南放下只吃了一口的羊汤面,蹭地站起身,快步离开食堂。
正在低头吃饭的姚梦娜一愣,旋即意识到常浩南这还是在思考刚才她提出来的问题。
常浩南思索半晌,又在纸上写下了三个基本条件:
但与此同时,这一组数据又往往不只能描述这一个含义。
给定一组高维数据x=rd,n为数据样本个数,d为高维数据的维数。
实际上,他此时就面临着无法从大量繁杂信息中提取出有价值信息的困境。
但常浩南仍然没有动筷子。
“信息……”
而反过来,现实中收集到的信息,在多数情况下,本身就是已经展开过的高维数据。
虽然她觉得在两位博士面前有点班门弄斧,但最后还是没忍住:
尽管仍然没有给出完整的思路,但是,他至少已经把三个抽象的基本条件解析成为了一个具体的数学问题。
3、提取到高质量的数据特征,提升后续的数据表示和分类任务的效果。
“你们说……”
朱雅丹满脑袋问号地抬起头,但看着常浩南思考的样子,很有自知之明地没有打扰。
再假设x中的数据样本来自于或近似来自于低维嵌入空间中的数据y=rd。
寻找一个从高维观测空间到低维嵌入空间的映射关系,使得yi=,以及一个一对一的重构映射关系-1,使得xi=-1。
“调料包大概占整包方便面重量的10%左右,如果少放或者多放,那应该很容易检测出来。”
而对于稍复杂一些的情况来说,要完全描述一个含义,往往需要一组数据。
而系统,则首先需要构建出一个完整且可行的思路出来。
“人类的大脑能够通过某种办法解析高维数据,从而获取对外部世界的感知。”
实际生活中面临的,其实大多数也是这种问题。