C++ MFC MD5 SHA1 SHA256 | 文件哈希计算器

md5 sha1 sha256 mfc 文件哈希文件hash

下载链接：

http://www.kuaipan.cn/file/id_13122516658684986.htm

这两天为庆祝考试结束而做，放图：

filehash

实现功能有：

1.选择或拖放文件

2.计算文件的md5，sha1，sha256

主要问题有：

1算法问题：

无可避免的第一个问题是三种算法的实现。算法在维基百科上都有详细描述，但主要问题是存放数据的方式，这里纠结了很久。

sha1/256存放数据的方式很特别，它是按每4字节为单位小端存储存放的，例如文件内容是“abc”三个字符，那么sha系列组织文件的格式在内存里是80 63 62 61，当成无符号整型输出才是61 62 63 80.这里十分坑爹啊，要对所有的输入都进行每4字节的小端调换。最后文件大小（bit为单位）使用的是8位的无符号整型存储，但你直接把最后八位当成unsigned __int64存储,这时内存里是（18 00 00 00 00 00 00 00），但不行，要前后要调换过来，在内存里是（00 00 00 00 18 00 00 00 ）。很坑爹吧？

最后总结得出：sha系列的存放格式你就按照16个无符号整型来打印，最后结果能符合文件原来应有的格式，那就对了。还是拿“abc”来做例子，最后组织完的512位，按每32位一个无符号整型输出结果是：（61 62 63 80 00 00 00 00 ….. 00 00 00 00 00 00 00 18），但其实在内存里他们是（80 63 62 61 00 00 00 00 ….. 00 00 00 00 18 00 00 00）。

我是先搞的sha1，纠结在这里纠结了很久，最后发现如此坑爹，于是去做md5，以为md5跟sha1一样也是坑爹的存储方式（因为在网上他们的存储方式描述是一摸一样的），但后来出来结果不正确，搞了N久才发现，md5是用正常的存放方式的，意思是”abc”这样的文件，在内存就直接是（61 62 63 80 00 00 00 00 ….. 18 00 00 00 00 00 00 00），不需要做什么坑爹调换。

真的很坑爹，不过还好，经过这次以后，对数据存放，大端存储小端存储什么的都有了一定了解了，也算是被坑的回报吧。

2.效率问题

三种算法都是以512位为单位，将文件切割来计算的，但如果每次IO都只读取512位，那频繁的io会使程序十分慢。我的做法是一次io从磁盘上读取10M数据放内存里，再对这部分进行计算，这样效率就不会受频繁io影响。不过这里就有一些额外的情况需要处理，逻辑会变得复杂点，不过没什么好讲的，自己做做就知道。

3.边界问题

当数据大小（字节）%64 大于55时，这种情况下补一个80就不够存文件大小了，文件大小在要一个新的512位里面在最后放置，这个bug开始实现时没注意到。

4.界面问题

界面其实没啥新内容，选择文件，多线程计算，进度条控制这些之前代码统计器都做过，就是多了个拖放功能，但其实只是响应个消息而已。

好了，差不多就这样子，这次没怎么测试过就放上来了，如果有bug请多多见谅并通知小弟，欢迎交流。

2011.06.24 sitar发现一个bug，我还是太嫩了。

C++ MFC MD5 SHA1 SHA256 | 文件哈希计算器

3 Responses to C++ MFC MD5 SHA1 SHA256 | 文件哈希计算器

发表评论取消回复

近期文章

近期评论

功能

C++ MFC MD5 SHA1 SHA256 | 文件哈希计算器

3 Responses to C++ MFC MD5 SHA1 SHA256 | 文件哈希计算器

发表评论 取消回复

近期文章

近期评论

功能

发表评论取消回复