Rust编程-核心篇-不安全编程_rust安全性

zhezhongyun 2025-10-23 14:16 78 浏览

Unsafe的必要性

Rust的所有权系统和类型系统为我们提供了强大的安全保障，但在某些情况下，我们需要突破这些限制来：

与C代码交互
实现底层系统编程
优化性能关键代码
实现某些编译器无法验证的安全操作

Rust的unsafe关键字不是要我们放弃安全性，而是让我们在明确标记的边界内，承担起确保代码安全的责任。unsafe代码块是Rust安全模型的重要组成部分，它们让我们能够构建安全的抽象。

Unsafe的基础概念

什么是Unsafe？

unsafe fn dangerous_function() {
    // 这里可以执行不安全的操作
}

unsafe {
    // 不安全的代码块
    dangerous_function();
}

Unsafe的五个超能力

解引用裸指针
调用unsafe函数或方法
访问或修改可变静态变量
实现unsafe trait
访问union的字段

裸指针

创建和使用裸指针

fn main() {
    let mut num = 5;
    
    // 创建不可变裸指针
    let r1 = &num as *const i32;
    // 创建可变裸指针
    let r2 = &mut num as *mut i32;
    
    unsafe {
        println!("r1 is: {}", *r1);
        println!("r2 is: {}", *r2);
        
        // 修改通过裸指针指向的值
        *r2 = 10;
        println!("After modification: {}", *r1);
    }
}

裸指针的实际应用：实现自定义智能指针

use std::ops::Deref;
use std::ops::DerefMut;

struct MyBox<T> {
    ptr: *mut T,
}

impl<T> MyBox<T> {
    fn new(value: T) -> Self {
        let boxed = Box::new(value);
        let ptr = Box::into_raw(boxed);
        MyBox { ptr }
    }
}

impl<T> Deref for MyBox<T> {
    type Target = T;
    
    fn deref(&self) -> &Self::Target {
        unsafe { &*self.ptr }
    }
}

impl<T> DerefMut for MyBox<T> {
    fn deref_mut(&mut self) -> &mut Self::Target {
        unsafe { &mut *self.ptr }
    }
}

impl<T> Drop for MyBox<T> {
    fn drop(&mut self) {
        unsafe {
            let _ = Box::from_raw(self.ptr);
        }
    }
}

fn main() {
    let mut my_box = MyBox::new(42);
    println!("Value: {}", *my_box);
    *my_box = 100;
    println!("New value: {}", *my_box);
}

调用Unsafe函数

标准库中的Unsafe函数

use std::slice;

fn main() {
    let mut v = vec![1, 2, 3, 4, 5, 6];
    
    let r = &mut v[..];
    
    let (a, b) = r.split_at_mut(3);
    
    assert_eq!(a, &mut [1, 2, 3]);
    assert_eq!(b, &mut [4, 5, 6]);
}

// 手动实现split_at_mut
fn split_at_mut(values: &mut [i32], mid: usize) -> (&mut [i32], &mut [i32]) {
    let len = values.len();
    let ptr = values.as_mut_ptr();
    
    assert!(mid <= len);
    
    unsafe {
        (
            slice::from_raw_parts_mut(ptr, mid),
            slice::from_raw_parts_mut(ptr.add(mid), len - mid),
        )
    }
}

实现Unsafe函数

use std::slice;

unsafe fn dangerous_function(ptr: *const i32, len: usize) -> &'static [i32] {
    slice::from_raw_parts(ptr, len)
}

fn main() {
    let mut vector = vec![1, 2, 3, 4, 5];
    let (left, right) = vector.split_at_mut(2);
    
    unsafe {
        let slice = dangerous_function(left.as_ptr(), left.len());
        println!("Slice: {:?}", slice);
    }
}

可变静态变量

全局可变状态

static mut COUNTER: u32 = 0;

fn add_to_count(inc: u32) {
    unsafe {
        COUNTER += inc;
    }
}

fn main() {
    add_to_count(3);
    
    unsafe {
        println!("COUNTER: {}", COUNTER);
    }
}

线程安全的全局状态

use std::sync::atomic::{AtomicUsize, Ordering};

static COUNTER: AtomicUsize = AtomicUsize::new(0);

fn add_to_count(inc: usize) {
    COUNTER.fetch_add(inc, Ordering::SeqCst);
}

fn main() {
    add_to_count(3);
    println!("COUNTER: {}", COUNTER.load(Ordering::SeqCst));
}

Unsafe Trait

实现Unsafe Trait

unsafe trait UnsafeTrait {
    fn dangerous_method(&self);
}

unsafe impl UnsafeTrait for i32 {
    fn dangerous_method(&self) {
        println!("Dangerous method called on: {}", self);
    }
}

fn main() {
    let x = 42;
    unsafe {
        x.dangerous_method();
    }
}

实际应用：Send和Sync

use std::thread;

struct MyStruct {
    data: *mut i32,
}

// 手动实现Send和Sync
unsafe impl Send for MyStruct {}
unsafe impl Sync for MyStruct {}

impl MyStruct {
    fn new(value: i32) -> Self {
        let boxed = Box::new(value);
        let ptr = Box::into_raw(boxed);
        MyStruct { data: ptr }
    }
    
    fn get(&self) -> i32 {
        unsafe { *self.data }
    }
    
    fn set(&self, value: i32) {
        unsafe { *self.data = value; }
    }
}

impl Drop for MyStruct {
    fn drop(&mut self) {
        unsafe {
            let _ = Box::from_raw(self.data);
        }
    }
}

fn main() {
    let my_struct = MyStruct::new(42);
    
    let handle = thread::spawn(move || {
        println!("Value: {}", my_struct.get());
        my_struct.set(100);
        println!("New value: {}", my_struct.get());
    });
    
    handle.join().unwrap();
}

实际应用

use std::alloc::{alloc, dealloc, Layout};
use std::ptr::NonNull;

struct MemoryPool {
    blocks: Vec<NonNull<u8>>,
    layout: Layout,
    block_size: usize,
}

impl MemoryPool {
    fn new(block_size: usize, initial_capacity: usize) -> Self {
        let layout = Layout::from_size_align(block_size, 8).unwrap();
        let mut blocks = Vec::with_capacity(initial_capacity);
        
        // 预分配一些内存块
        for _ in 0..initial_capacity {
            unsafe {
                let ptr = alloc(layout);
                if ptr.is_null() {
                    panic!("Failed to allocate memory");
                }
                blocks.push(NonNull::new_unchecked(ptr));
            }
        }
        
        Self {
            blocks,
            layout,
            block_size,
        }
    }
    
    fn allocate(&mut self) -> Option<NonNull<u8>> {
        self.blocks.pop()
    }
    
    fn deallocate(&mut self, ptr: NonNull<u8>) {
        self.blocks.push(ptr);
    }
}

impl Drop for MemoryPool {
    fn drop(&mut self) {
        for block in &self.blocks {
            unsafe {
                dealloc(block.as_ptr(), self.layout);
            }
        }
    }
}

fn main() {
    let mut pool = MemoryPool::new(1024, 10);
    
    if let Some(ptr) = pool.allocate() {
        unsafe {
            // 使用分配的内存
            let slice = std::slice::from_raw_parts_mut(ptr.as_ptr(), 1024);
            slice[0] = 42;
            println!("Allocated memory, first byte: {}", slice[0]);
        }
        
        // 归还内存
        pool.deallocate(ptr);
    }
}

FFI接口

use std::ffi::{CString, CStr};
use std::os::raw::c_char;

// 声明外部C函数
extern "C" {
    fn strlen(s: *const c_char) -> usize;
    fn strcpy(dst: *mut c_char, src: *const c_char) -> *mut c_char;
}

// 安全的Rust包装
pub fn safe_strlen(s: &str) -> usize {
    let c_string = CString::new(s).unwrap();
    unsafe { strlen(c_string.as_ptr()) }
}

pub fn safe_strcpy(dst: &mut [u8], src: &str) -> Result<(), String> {
    if dst.len() < src.len() + 1 {
        return Err("Destination buffer too small".to_string());
    }
    
    let c_src = CString::new(src).map_err(|_| "Invalid string")?;
    
    unsafe {
        strcpy(dst.as_mut_ptr() as *mut c_char, c_src.as_ptr());
    }
    
    Ok(())
}

fn main() {
    let s = "Hello, World!";
    println!("Length: {}", safe_strlen(s));
    
    let mut buffer = vec![0u8; 20];
    safe_strcpy(&mut buffer, s).unwrap();
    
    let result = unsafe {
        CStr::from_ptr(buffer.as_ptr() as *const c_char)
            .to_string_lossy()
    };
    println!("Copied string: {}", result);
}

零拷贝解析

use std::mem;

#[repr(C)]
struct Header {
    magic: u32,
    version: u16,
    length: u16,
}

impl Header {
    fn from_bytes(bytes: &[u8]) -> Result<&Self, &'static str> {
        if bytes.len() < mem::size_of::<Self>() {
            return Err("Insufficient data");
        }
        
        unsafe {
            let ptr = bytes.as_ptr() as *const Self;
            Ok(&*ptr)
        }
    }
    
    fn from_bytes_mut(bytes: &mut [u8]) -> Result<&mut Self, &'static str> {
        if bytes.len() < mem::size_of::<Self>() {
            return Err("Insufficient data");
        }
        
        unsafe {
            let ptr = bytes.as_mut_ptr() as *mut Self;
            Ok(&mut *ptr)
        }
    }
}

fn main() {
    let mut data = vec![0u8; 8];
    
    // 设置头部数据
    if let Ok(header) = Header::from_bytes_mut(&mut data) {
        header.magic = 0x12345678;
        header.version = 1;
        header.length = 8;
    }
    
    // 读取头部数据
    if let Ok(header) = Header::from_bytes(&data) {
        println!("Magic: 0x{:x}", header.magic);
        println!("Version: {}", header.version);
        println!("Length: {}", header.length);
    }
}

安全抽象

use std::ptr;

pub struct SafeVector<T> {
    ptr: *mut T,
    len: usize,
    capacity: usize,
}

impl<T> SafeVector<T> {
    pub fn new() -> Self {
        Self {
            ptr: ptr::null_mut(),
            len: 0,
            capacity: 0,
        }
    }
    
    pub fn push(&mut self, value: T) {
        if self.len == self.capacity {
            self.grow();
        }
        
        unsafe {
            let end = self.ptr.add(self.len);
            ptr::write(end, value);
        }
        
        self.len += 1;
    }
    
    pub fn pop(&mut self) -> Option<T> {
        if self.len == 0 {
            None
        } else {
            self.len -= 1;
            unsafe {
                let end = self.ptr.add(self.len);
                Some(ptr::read(end))
            }
        }
    }
    
    pub fn get(&self, index: usize) -> Option<&T> {
        if index < self.len {
            unsafe {
                Some(&*self.ptr.add(index))
            }
        } else {
            None
        }
    }
    
    fn grow(&mut self) {
        let new_capacity = if self.capacity == 0 { 1 } else { self.capacity * 2 };
        let new_size = new_capacity * std::mem::size_of::<T>();
        
        unsafe {
            let new_ptr = if self.capacity == 0 {
                std::alloc::alloc(std::alloc::Layout::from_size_align(new_size, std::mem::align_of::<T>()).unwrap())
            } else {
                std::alloc::realloc(
                    self.ptr as *mut u8,
                    std::alloc::Layout::from_size_align(self.capacity * std::mem::size_of::<T>(), std::mem::align_of::<T>()).unwrap(),
                    new_size
                )
            };
            
            if new_ptr.is_null() {
                panic!("Failed to allocate memory");
            }
            
            self.ptr = new_ptr as *mut T;
            self.capacity = new_capacity;
        }
    }
}

impl<T> Drop for SafeVector<T> {
    fn drop(&mut self) {
        if !self.ptr.is_null() {
            unsafe {
                // 调用所有元素的析构函数
                for i in 0..self.len {
                    ptr::drop_in_place(self.ptr.add(i));
                }
                
                // 释放内存
                std::alloc::dealloc(
                    self.ptr as *mut u8,
                    std::alloc::Layout::from_size_align(self.capacity * std::mem::size_of::<T>(), std::mem::align_of::<T>()).unwrap()
                );
            }
        }
    }
}

fn main() {
    let mut vec = SafeVector::new();
    vec.push(1);
    vec.push(2);
    vec.push(3);
    
    println!("Length: {}", vec.len);
    println!("First element: {:?}", vec.get(0));
    println!("Last element: {:?}", vec.get(2));
    
    while let Some(value) = vec.pop() {
        println!("Popped: {}", value);
    }
}

性能优化

避免边界检查

fn safe_sum(slice: &[i32]) -> i32 {
    slice.iter().sum()
}

fn unsafe_sum(slice: &[i32]) -> i32 {
    let mut sum = 0;
    let len = slice.len();
    
    unsafe {
        let ptr = slice.as_ptr();
        for i in 0..len {
            sum += *ptr.add(i);
        }
    }
    
    sum
}

fn main() {
    let data = vec![1, 2, 3, 4, 5];
    
    println!("Safe sum: {}", safe_sum(&data));
    println!("Unsafe sum: {}", unsafe_sum(&data));
}

常见陷阱与最佳实践

1. 避免悬垂指针

// 错误的做法
fn bad_function() -> &'static i32 {
    let x = 42;
    &x  // 返回局部变量的引用
}

// 正确的做法
fn good_function() -> i32 {
    let x = 42;
    x  // 返回值而不是引用
}

2. 确保内存对齐

use std::mem;

#[repr(align(16))]
struct AlignedStruct {
    data: [u8; 16],
}

fn main() {
    let aligned = AlignedStruct { data: [0; 16] };
    println!("Alignment: {}", mem::align_of_val(&aligned));
}

3. 使用工具检查

// 使用Miri检查未定义行为
// cargo +nightly miri run

// 使用AddressSanitizer
// RUSTFLAGS="-Z sanitizer=address" cargo run

写在最后

Rust的unsafe编程提供了：

底层控制：直接操作内存和硬件
性能优化：避免不必要的安全检查
FFI支持：与C代码交互
安全抽象：构建安全的API

Unsafe不是Rust的缺陷，而是其设计的重要组成部分。通过unsafe，我们可以在保持Rust安全模型的同时，获得底层编程的能力。关键是要将unsafe代码限制在最小的范围内，并通过安全的接口暴露功能。

1-2. 变量引用

上一篇：探秘 Python 内存管理:背后的神奇机制
下一篇：C++第五课:变量的命名规则_c++中变量的命名规则

Rust编程-核心篇-不安全编程_rust安全性

什么是Unsafe？

Unsafe的五个超能力

创建和使用裸指针

裸指针的实际应用：实现自定义智能指针

标准库中的Unsafe函数

实现Unsafe函数

全局可变状态

线程安全的全局状态

实现Unsafe Trait

实际应用：Send和Sync

避免边界检查

1. 避免悬垂指针

2. 确保内存对齐

3. 使用工具检查

写在最后

相关推荐

HTML标签速查手册?别死记硬背了，带你从原理上掌握它!

旧手机新玩法，MacroDeck进阶指南

推荐36种免费React模板和主题「干货」

用node.js实现一个网页爬虫（nodejs爬虫模拟浏览器）

业余无线电UV段几种常见天线（uv段最强天线）

免费领取→可编辑危废标签模板首发!

GitHub和码云上，7个h5页面制作工具推荐

VBA+BarTender:手搓一个外箱标签打印小工具

BarTender10.1条码软件如何制作模板标签

顶级Javaer，常用的 14 个类库