这是一个创建于 3135 天前的主题,其中的信息可能已经有所发展或是发生改变。
如果现在有一个文件,里面包含了一些内容,我该如何判断这些内容是无意义的(随机的?),还是包含了特定的内容,有什么判断方法或原理。
1 条回复 • 2016-03-23 19:27:34 +08:00
|
|
1
3dwelcome 2016-03-23 19:27:34 +08:00 via Android
信息熵可以判断文件里的随机度、但这个度量是表示数据可以压缩的程度、越随机文件就越难被压缩、并不能确认内容是否有价值。你也许需要机器学习算法。
|