关于显示加载动态链接库模块及卸载的问题
问题起因是,在一次模块卸载后,程序运行异常。遂对动态链接库做一些测试。
动态库加载方式有两种,隐式加载和显示加载,隐式加载包含xxx.lib导入库,在程序执行之前由动态加载器完成所有加载;显示加载则使用LoadLibrary方式;具体数据可参考《程序员的自我修养:链接,装载与库》一书。
动态库头文件:


1 #ifdef DYNAMICLIBRARYTEST_EXPORTS
2 #define DYNAMICLIBRARYTEST_API __declspec(dllexport)
3 #else
4 #define DYNAMICLIBRARYTEST_API __declspec(dllimport)
5 #endif
6
7 // 此类是从 dll 导出的
8 class DYNAMICLIBRARYTEST_API Base {
9 public:
10 Base(void);
11
12 virtual int* virtualFunc();
13 virtual ~Base();
14
15
16 int a = 8;
17 int b = 9;
18 char c[10] = {'H','e', 'l', 'l', 'o', 'W', 'o', 'r', 'l', 'd' };
19 // TODO: 在此处添加方法。
20 };
21
22 class DYNAMICLIBRARYTEST_API Derive : public Base
23 {
24 public:
25 Derive(void);
26 int* normalFunc()
27 {
28 return nullptr;
29 }
30
31 int* virtualFunc() override;
32 ~Derive();
33 // TODO: 在此处添加方法。
34 };
35
36 extern "C" DYNAMICLIBRARYTEST_API int i_global;
37
38 extern "C" DYNAMICLIBRARYTEST_API double d_global;
39
40 extern "C" DYNAMICLIBRARYTEST_API char c_global[6];
41
42 extern "C" DYNAMICLIBRARYTEST_API int func1(void);
43 extern "C" DYNAMICLIBRARYTEST_API Derive* createDerive();
View Code
动态库实现文件:


1 // DynamicLibraryTest.cpp : 定义 DLL 的导出函数。
2 //
3
4 #include "DynamicLibraryTest.h"
5 // 这是导出变量的一个示例
6 DYNAMICLIBRARYTEST_API int i_global = 1;
7 int i_global_1 = 9;
8 DYNAMICLIBRARYTEST_API double d_global = 2 ;
9 DYNAMICLIBRARYTEST_API char c_global[6] = {'G', 'l','o', 'b', 'a', 'l'};
10
11 // 这是导出函数的一个示例。
12 DYNAMICLIBRARYTEST_API int func1(void)
13 {
14 return -1;
15 }
16
17 Derive * createDerive()
18 {
19 return new Derive;
20 }
21
22 Base::Base()
23 {
24 return;
25 }
26
27
28 int* Base::virtualFunc()
29 {
30 return nullptr;
31 }
32
33 Base::~Base()
34 {
35 }
36
37 Derive::Derive(void)
38 {
39 }
40
41 int* Derive::virtualFunc()
42 {
43 int c = a + b;
44 c--;
45 return new int[10];
46 }
47
48 Derive::~Derive()
49 {
50 }
View Code
查看导出符号:

可以看到导出的变量命名比较正常,这是因为是以C风格导出的。不然就是C++的诡异风格修饰。
主程序实现:project.cpp
1 // project.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。
2 //
3
4 #include <iostream>
5 #include "DynamicLibraryTest.h"
6 #include <Windows.h>
7
8 #define LIBNAME "C:/Users/Admin/source/repos/DynamicLibraryTest/Release/DLL_1.dll"
9
10 typedef int*(*NormalFunc)();
11 typedef Derive*(*CreateDerive)();
12 int main()
13 {
14 const char* szStr = LIBNAME;
15 WCHAR wszClassName[256];
16 memset(wszClassName, 0, sizeof(wszClassName));
17 MultiByteToWideChar(CP_ACP, 0, szStr, strlen(szStr) + 1, wszClassName, sizeof(wszClassName) / sizeof(wszClassName[0]));
18 HMODULE hmodule = ::LoadLibrary(wszClassName);
19 if (NULL == hmodule)
20 {
21 printf("LoadLibrary failed/n");
22 return -1;
23 }
24
25 CreateDerive funcDerive = (CreateDerive)GetProcAddress(hmodule, "createDerive");
26 NormalFunc nor = (NormalFunc)GetProcAddress(hmodule, "?normalFunc@Derive@@QAEPAHXZ");
27 Derive* d = funcDerive();//分配在堆上
28 Derive* d2 = funcDerive();
29 //d->normalFunc();//不能直接调用非虚函数
30 //本模块保存了一份虚表地址在堆上,每次访问虚函数,通过堆上的保存的虚表地址查找真正的虚表,
31 //而虚表保存在映射区域(dll模块的全局常量区,不过映射的数据区域为备份),随着模块的卸载,该映射区域也会消失,导致访问异常。
32 //至于为什么显示加载dll的方式不能调用非虚函数,是因为调用这种函数不需要查虚表,直接调函数地址,但该函数导出名字经过修饰,
33 //会造成无法解析的引用; 子类和父类都有一套虚表,存的是各自的函数地址。
34 int* vb = d->virtualFunc();//ecx寄存器保存的是this指针,即d;
35 d2->a = 2;
36 _asm
37 {
38 mov ecx, dword ptr[d2];
39 }
40 nor();//此时调用的是d2的成员函数。
41 delete d;
42 int *local = new int[10];
43 vb[0] = 1;
44 local[0] = 2;
45 int c = vb[0] + local[0];
46
47 ::FreeLibrary(hmodule);
48 //int* va = d->virtualFunc();//报错
49 return 0;
50 }
显示加载后,得到类对象d,是不能直接通过该对象调用其非虚成员函数的(链接不通过),但是能直接调用虚函数。问题是因为调用虚函数是要查虚表的。下图是project.obj的main部分反汇编代码:

可以看到对于一般的函数调用会生成函数符号,相当于一个占位标记,该符号地址在链接前,用默认地址00 00 00 00 代替(32位机器下),在执行链接后,该默认地址会修改为正确的位置。
链接后的main部分反编译代码:

回到之前的那个问题,为什么一般的成员函数不能直接调用,因为找不到符号(无法解析的引用符号),会导致链接不过。
第一,导出该符号(整个类都是导出的话,该成员函数自然也是导出的)。第二,该符号的名字要写对;
NormalFunc nor = (NormalFunc)GetProcAddress(hmodule, "?normalFunc@Derive@@QAEPAHXZ");
强行获取该方法。那么又有一个问题,这个函数该怎么调用?对于任意一个成员函数来讲,调用会存在一个this指针。直接调用会出现奇怪的现象。其实通常调用成员函数,从汇编的角度,会将this指针赋值给ecx寄存器。接着调用该函数。


上图可以看到ecx与this的关系。通过证实nor()执行的确实是d2的成员函数。
接着下一个问题,卸载模块后,在该模块申请的堆内存数据还在不在?以及能不能继续调用该模块的成员函数。
下图先给出该进程的内存布局(x64Dbg反编译工具):

执行完LoadLibrary后的内存布局:

可以看到dll_1映射到了某个内存地址。
查看dll中normalFunc的函数地址:

对应于dll的代码段映射区域。
查看d和d2的内存区域:

可以看到这两个变量所对应的首4字节值是一样的,这就是虚表地址。
转到虚表地址:

发现该虚表存储在DLL_1的内存区域“.rdata ”段(从前面的内存布局看出)。
那么当真个DLL被卸载时发生了什么?执行完Freelibrary后:



那么显而易见,卸载dll模块后,变量d2是不能调用任何函数的,因为此时地址都清空了,包括虚函数,虚表不存在。而d2这个变量所对应的内存空间依然存在。但是意味着该类对象没法调用析构函数,造成内存泄漏。
其实,在dll申请的内存,最好在该dll里释放,不然会出现奇怪的现象。
。。。待续
