HOOK概述
HOOK
,中文译为“挂钩”或“钩子”。在iOS
逆向中是指改变程序运行流程的一种技术。通过HOOK
可以让别人的程序执行自己所写的代码。在逆向中经常使用这种技术。所以在学习过程中,我们重点要了解其原理,这样能够对恶意代码进行有效的防护
HOOK
示意图
iOS
中HOOK
技术的几种方式:
Method Swizzle
:主要用于OC
方法,利用OC
的Runtime
特性,动态改变SEL
(方法编号)和IMP
(方法实现)的对应关系,达到OC
方法调用流程改变的目的fishhook
:MachO
文件的工具。利用MachO
文件加载原理,通过修改懒加载和非懒加载两个表的指针,达到对C函数
进行HOOK
的目的Cydia Substrate
:原名为Mobile Substrate
,它的主要作用是针对OC
方法、C函数
以及函数地址进行HOOK
操作。当然它并不是仅仅针对iOS
而设计的,安卓一样可以使用。官方地址
Method Swizzle
利用OC
的Runtime
特性,动态改变SEL
(方法编号)和IMP
(方法实现)的对应关系,达到OC
方法调用流程改变的目的。主要用于OC
方法。
在
OC
中,SEL
和IMP
之间的关系,就好像一本书的“目录
”
SEL
是方法编号,就像“标题
”一样IMP
是方法实现的真实地址,就像“页码
”一样- 它们是一一对应的关系
Runtime
提供了交换两个SEL
和IMP
对应关系的函数
OBJC_EXPORT void
method_exchangeImplementations(Method _Nonnull m1, Method _Nonnull m2)
OBJC_AVAILABLE(10.5, 2.0, 9.0, 1.0, 2.0);
通过这个函数交换两个
SEL
和IMP
对应关系的技术,我们称之为Method Swizzle
(方法欺骗)
多种
HOOK
方式
class_addMethod
方式:让原始方法可以被调用,不至于因为找不到SEL
而崩溃class_replaceMethod
方式:直接给原始的方法替换IMP
method_setImplementation
方式:直接重新赋值新的IMP
Cydia Substrate
MobileHooker
顾名思义用于
HOOK
。它定义一系列的宏和函数,底层调用objc
的runtime
和fishhook
来替换系统或者目标应用的函数其中有两个函数:
MSHookMessageEx
:主要作用于Objective-C
方法
void MSHookMessageEx(Class class, SEL selector, IMP replacement, IMP result)
MSHookFunction
:主要作用于C
和C++
函数,Logos
语法的%hook
就是对以下函数做了一层封装
void MSHookFunction(void function, void* replacement, void** p_original)
MobileLoader
MobileLoader
用于加载第三方dylib
在运行的应用程序中。启动时MobileLoader
会根据规则把指定目录的第三方的动态库加载进去,第三方的动态库也就是我们写的破解程序
safe mode
破解程序本质是
dylib
,寄生在别人进程里。 系统进程一旦出错,可能导致整个进程崩溃,崩溃后就会造成iOS
瘫痪。所以Cydia Substrate
引入了安全模式,在安全模式下所有基于Cydia Substratede
的三方dylib
都会被禁用,便于查错与修复
fishHook
获取代码
git clone https://github.com/facebook/fishhook.git
关键函数
FISHHOOK_VISIBILITY
int rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel);
rebindings
:存放rebinding
结构体的数组,可以同时交换多个函数rebindings_nel
:数组的长度
rebinding
结构体
struct rebinding {
const char *name;
void *replacement;
void **replaced;
};
name
:需要HOOK
的函数名称,C
字符串replacement
:新函数的地址replaced
:原始函数地址的指针案例1:
HOOK
系统NSLog
函数打开
ViewController.m
文件,定义新函数
void my_NSLog(NSString *format, ...) {
format = [format stringByAppendingString:@"~~~🍺🍺🍺🍺🍺"];
sys_NSLog(format);
}
定义函数指针,用于保存
NSLog
系统函数地址
static void (*sys_NSLog)(NSString *format, ...);
viewDidLoad
方法中,写入以下代码:```
- (void)viewDidLoad { [super viewDidLoad];
struct rebinding reb; reb.name=”NSLog”; reb.replacement=my_NSLog; reb.replaced=(void *)&sys_NSLog;
struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1); }
> 添加`touchesBegan`方法
>
-(void)touchesBegan:(NSSet
> 真机运行项目,点击屏幕,输出以下内容:
>
fishhookDemo[2072:399007] hahaha~~~🍺🍺🍺🍺🍺
> `fishHook`可以`HOOK`我们的`C函数`,但是我们知道函数是静态的,也就是说在编译的时候,编译器就知道了它的实现地址,这也是为什么`C函数`只写函数声明调用时会报错。那么为什么`fishHook`还能够改变`C函数`的调用呢?难道函数也有动态的特性存在?
> 案例2:
> `HOOK`自定义函数
> 打开`ViewController.m`文件,定义自定义函数
>
void test(NSString *format, …){ NSLog(@”hahaha”); }
> 定义新函数
>
void my_test(NSString *format, …){ format = [format stringByAppendingString:@”~~~🍺🍺🍺🍺🍺”]; sys_test(format); }
> 定义函数指针,用于保存`test`自定义函数地址
>
static void (sys_test)(NSString format, …);
> `viewDidLoad`方法中,写入以下代码:
>
(void)viewDidLoad { [super viewDidLoad];
struct rebinding reb; reb.name=”test”; reb.replacement=my_test; reb.replaced=(void *)&sys_test;
struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1); } ```
添加
touchesBegan
方法
-(void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
test(@"hahaha");
}
真机运行项目,点击屏幕,输出以下内容:
fishhookDemo[2117:410009] hahaha
在
案例2
中,HOOK
自定义test
函数并没有效果。NSLog
是系统函数,而test
是当前MachO
中的函数,它们之间有什么区别?
fishHook原理探究
一般来说,静态语言通过地址直接访问,例如
案例2
中的test
函数。但对于NSLog
系统函数来说,它属于外部调用函数,编译时并不能找到它的真实地址
NSLog
存储在Fundation
框架中,App
运行在不同系统版本的不同设备上,每个设备中NSLog
的函数地址都各不相同再有,当
App
启动时,会涉及ASLR
(地址空间配置随机加载),导致程序运行它的虚拟内存地址都不一样这些原因,都会造成外部函数的真实地址,在编译时期是无法确定的
那外部函数是如何被调用的?
当
App
启动时,dyld
读取主程序MachO
文件,会加载共享缓存中的系统库,将用到的函数真实地址告诉MachO
对于
MachO
中的代码段来说,它是只读的。在运行时,无法直接修改外部函数的真实地址对于上述情况,苹果采用
PIC
技术(位置独立代码),在MachO
调用外部函数时,在可读可写的数据段,定义符号,占8字节
,用来存放外部函数的地址。编译时,暂存占位地址。运行时,dyld
将符号绑定真实函数地址。对于代码段来说,并没有任何改变故此,外部调用函数,并不是直接地址访问,而是通过符号找到地址。这跟
OC
中SEL
与IMP
的对应关系非常相似。这种机制,可以让开发者动态HOOK
外部调用函数在
OC
中动态改变SEL
与IMP
的对应关系,对于外部调用函数,动态改变的是符号和地址的对应关系,上述操作称为:符号表重绑定案例1
查看
NSLog
加载前的占位地址查看
MachO
文件
NSLog
函数,存储在懒加载符号表中。dyld
加载MachO
时,绑定非懒加载符号和弱引用符号,而懒加载符号,则是在首次使用时动态绑定打开
ViewController.m
文件,修改viewDidLoad
代码```
- (void)viewDidLoad { [super viewDidLoad];
NSLog(@”begin”);
struct rebinding reb; reb.name=”NSLog”; reb.replacement=my_NSLog; reb.replaced=(void *)&sys_NSLog;
struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1);
NSLog(@”end”); }
> 在`begin`和`end`设置两处断点,真机运行项目<br />

> 使用`image list`命令,找到程序虚拟内存的首地址<br />

> - 首地址:`0x102c48000`
> - `ASLR`:`0x2c48000`
> 查看`NSLog`在`MachO`中的偏移地址和占位地址<br />

> - 偏移地址:`0xC000`
> - 占位地址:`0x1000064C0`
> 在`lldb`中,使用`程序首地址 + 偏移地址`,找到`NSLog`加载前的占位地址<br />

> - 在`lldb`中,获取的`NSLog`占位地址为`0x102c4e4c0`,和`MachO`中看到的`0x1000064C0`并不一样
> 因为`MachO`中的占位地址,还要加上程序启动时的`ASLR`随机偏移地址<br />

> - `占位地址 + ASLR = 0x102c4e4c0`,和`lldb`中读取出的地址一致
> 案例2
> 查看`NSLog`加载后的真实地址
> 承接`案例1`,断点向下执行<br />

> 在`lldb`中,使用`程序首地址 + 偏移地址`,找到`NSLog`加载后的真实地址<br />

> - 之前的占位地址`0x102c4e4c0`,被真实地址`0x19d9327f0`替换
> 使用`dis -s 0x19d9327f0`命令,读取地址中的代码
>
dis -s 0x000000019d9327f0
Foundation`NSLog: 0x19d9327f0 <+0>: sub sp, sp, #0x20 ; =0x20 0x19d9327f4 <+4>: stp x29, x30, [sp, #0x10] 0x19d9327f8 <+8>: add x29, sp, #0x10 ; =0x10 0x19d9327fc <+12>: adrp x8, 311278 0x19d932800 <+16>: ldr x8, [x8, #0xb70] 0x19d932804 <+20>: ldr x8, [x8] 0x19d932808 <+24>: str x8, [sp, #0x8] 0x19d93280c <+28>: add x8, x29, #0x10 ; =0x10
> - 指向`NSLog`代码
> 案例3
> 查看交换后的函数地址
> 承接`案例2`,断点向下执行<br />

> 在`lldb`中,使用`程序首地址 + 偏移地址`,找到`NSLog`交换后的函数地址<br />

> - 原本`NSLog`的真实地址为`0x19d9327f0`,交换后变为`0x102c4d57c`
> 使用`dis -s 0x102c4d57c`命令,读取地址中的代码
>
dis -s 0x102c4d57c
fishhookDemo`my_NSLog: 0x102c4d57c <+0>: sub sp, sp, #0x30 ; =0x30 0x102c4d580 <+4>: stp x29, x30, [sp, #0x20] 0x102c4d584 <+8>: add x29, sp, #0x20 ; =0x20 0x102c4d588 <+12>: sub x8, x29, #0x8 ; =0x8 0x102c4d58c <+16>: mov x9, #0x0 0x102c4d590 <+20>: stur x9, [x29, #-0x8] 0x102c4d594 <+24>: str x0, [sp, #0x10] 0x102c4d598 <+28>: mov x0, x8
> 指向`my_NSLog`代码
> 由此可见,`HOOK`外部的`C函数`,本质就是在修改符号和地址的对应关系
#####符号绑定的过程
> - `Symbol Table`:符号表,⽤来保存符号
> - `String Table`:字符串表,⽤来保存符号的名称
> - `Indirect Symbol Table`:间接符号表,保存使⽤的外部符号。更准确⼀点就是使⽤的外部动态库的符号。是`Symbol Table`的子集
> 代码中的函数名、变量名、方法名,在项目编译后,都会生成一张符号表。符号之间也有差别,分为内部符号和外部符号
> 内部符号是当前`MachO`中的符号,而外部符号又称为间接符号,例如:系统库、动态库中的符号
> 符号按可见性划分,分为全局符号和本地符号
> - 全局符号对整个项目可见
> - 本地符号仅对当前文件可见
> 案例1:
> 符号绑定的过程
> 打开`ViewController.m`文件,写入以下代码:
>
import “ViewController.h”
@implementation ViewController
(void)viewDidLoad { [super viewDidLoad];
NSLog(@”第一次外部函数的调用!”); NSLog(@”第二次外部函数的调用!”); }
@end
> 真机运行项目,来到`viewDidLoad`方法:<br />

> - 两次`NSLog`的指令都是`bl 0x1022ba4d8`
> 使用`image list`命令,找到程序虚拟内存的首地址<br />

> - 首地址:`0x1022b4000`
> 使用`NSLog地址 - 首地址`计算偏移地址<br />

> - 偏移地址:`0x64d8`
> 打开`MachO`文件,找到偏移地址为`0x64d8`的位置<br />

> - 处于`__TEXT,__stubs`中
> - `__stubs`:符号桩,本质上就是一段代码,用于跳转到懒加载符号表中,找到对应符号的值
> - `0x64d8`即是`NSLog`的桩
> 在`fishHook`原理探究中,多次提到跳转到占位地址,这种说法并不准确。真实的情况是,会跳转到外部符号的桩,本质上就是一段代码
> 案例2:
> 查看桩对应的代码
> 查看`MachO`文件,找到桩对应的值<br />

> - `1F2003D530D9025800021FD6`:以二进制指令的形式存储的代码
> 单步调试,来到`NSLog`函数<br />

> 使用`x 0x1022ba4d8`命令,读取地址中的值,以二进制形式显示<br />

> - `1F2003D530D9025800021FD6`,和`MachO`中对应的指令一致
> 有此可见,`1F2003D530D9025800021FD6`对应的就是上述三句汇编代码
> 案例3:
> 三句汇编代码的含义?
> 断点执行到`br x16`指令<br />

> - `br`指令:跳转到`x16`寄存器存储的地址
> 查看`x16`寄存器存储的地址,再减去`ASLR`偏移地址<br />

> - 得到地址:`0x10000658c`
> 查看`MachO`文件,找到`0x10000658c`地址<br />

> - 指向懒加载符号表中`NSLog`符号的值
> 三句汇编代码的含义:找到懒加载符号表中的地址去执行
> 案例4:
> 懒加载符号表中的地址,指向的代码是什么?
> 在`MachO`中,找到偏移地址`0x658c`,指向`__TEXT,__stubs_helper`中的代码<br />

> - `b`指令,跳转到偏移地址为`0x6574`的位置执行代码
> 在`MachO`中,找到偏移地址为`0x6574`的位置<br />

> - `x16`寄存器,偏移地址为`0x8000`
> - `br`指令,跳转到偏移地址为`0x8000`位置执行代码
> 在`MachO`中,找到偏移地址为`0x8000`的位置<br />

> - 处于非懒加载符号表中
> - 执行`dyld_stub_binder`函数,用于符号绑定
> 懒加载符号表中的地址,指向寻找并执行`dyld_stub_binder`函数的代码
> 案例5:
> `dyld_stub_binder`也是外部函数,它的地址是如何找到的?
> 在`MachO`中,可以看到`dyld_stub_binder`函数的偏移地址为`0x8000`,但全是`0`,说明此时还没有值
> `dyld_stub_binder`函数,同样是外部函数,存储在非懒加载表中
> 当`dyld`加载主程序时,会绑定非懒加载符号和弱引用符号,所以`dyld_stub_binder`函数的值,在程序启动时被`dyld`直接绑定
> 真机运行项目,读取`首地址 + 0x8000`地址中的值<br />

> 使用`dis -s 0x19c2e6f94`命令,读取地址中的代码
>
libdyld.dylib`dyld_stub_binder: 0x19c2e6f94 <+0>: stp x29, x30, [sp, #-0x10]! 0x19c2e6f98 <+4>: mov x29, sp 0x19c2e6f9c <+8>: sub sp, sp, #0xf0 ; =0xf0 0x19c2e6fa0 <+12>: stp x0, x1, [x29, #-0x10] 0x19c2e6fa4 <+16>: stp x2, x3, [x29, #-0x20] 0x19c2e6fa8 <+20>: stp x4, x5, [x29, #-0x30] 0x19c2e6fac <+24>: stp x6, x7, [x29, #-0x40] 0x19c2e6fb0 <+28>: stp x8, x9, [x29, #-0x50] ```
案例6:
NSLog
函数,首次加载和非首次加载的区别真机运行项目,首次加载
NSLog
函数
- 先找到桩里面的代码
- 找到懒加载符号表中的地址去执行
- 指向
__stubs_helper
中的代码- 寻找并执行
dyld_stub_binder
函数- 符号表重绑定
再次加载
NSLog
函数
- 找到桩里面的代码
- 找到懒加载符号表中的地址去执行
- 首次加载
NSLog
函数,懒加载符号表中的地址,因重绑定而修改- 修改后的值,直接指向
NSLog
函数的真实地址
通过符号找到字符串
fishHook
提供的rebinding
结构体,其中name
为需要HOOK
的函数名称作用:当找到相应的符号,再通过符号找到字符串,然后和
name
进行字符串比较,如果匹配成功,则替换函数指针
案例1:
通过懒加载符号表中的符号,找到间接符号表中的相同符号,再找到符号对应的值
__la_symbol_ptr
懒加载符号表中的符号和顺序,跟间接符号表一致
在
Dynamic Symbol Table
中,找到NSLog
的值
案例2:
间接符号表中
NSLog
的值为0xB8
,转为10进制
为184
184
对应的是此符号在符号总表中的角标在
Symbol Table
中,通过角标找到符号,再找到String Table Index
的值
案例3:
符号表中
NSLog
的String Table Index
值为0xCE
,表示在字符串表中的偏移地址在
String Table
中,找到首地址
首地址
:0x11230
通过
首地址 + 偏移值 = 0x112FE
,找到对应字符串
_
是函数的开始,.
是分隔符 。5F
从_
开始,往后读取_NSLog
,遇到分隔符结束
总结
HOOK
- 钩子,改变程序执行流程的一种技术
Method Swizzle
利用OC
运行时的特性,修改SEL
和IMP
的对应关系,达到对OC
方法HOOK
的目的
IMP
,本质上是函数指针method_exchangeImplementations
:交互两个IMP
class_replaceMethod
:替换某个SEL
的IMP
,如果没有该方法,使用class_addMethod
添加method_getImplementation
、method_setImplementation
:获取和设置某个方法的IMP
,很多三方框架都使用这种方式
fishHook
MachO
文件的加载原理,动态修改懒加载和非懒加载两张符号表- 可以
HOOK
系统函数,但是无法HOOK
自定义函数
fishHook
原理解析
- 共享缓存:
iOS
系统有一块特殊的位置,存放公用动态库。即:动态库共享缓存(dyld shared cache
)PIC
技术:由于外部函数调用,在编译时期无法确定内存地址。苹果采用PIC
技术(位置独立代码),在MachO
文件的DATA
段,建立懒加载和非懒加载两张符号表,里面存放执行外部函数的指针符号绑定过程
- 外部函数调用,先找到桩里面的代码,
__TEXT,__stubs
- 找到懒加载符号表中的地址去执行
外部函数,首次加载
- 懒加载符号表中的地址,指向
__TEXT,__stubs_helper
中的代码- 通过代码寻找并执行
dyld_stub_binder
函数- 作用:符号表重绑定
外部函数,非首次加载
- 懒加载符号表中的地址,因重绑定而修改
- 修改后的值,直接指向外部函数的真实地址
dyld_stub_binder
函数
- 存储在非懒加载符号表中
- 当
dyld
加载主程序时,符号被dyld
直接绑定通过符号找到字符串
fishHook
利用Lazy Symbol Table
→Indirect Symbol Table
→Symbol Table
→String Table
,通过重绑定修改指针的值达到HOOK
目的