chapter6练习

  • 本节难度: 大魔王!!

本章任务

  • ch6b_usertest ch6_mergetest

  • 结合代码、指导书已经课堂所学,理解文件系统的几个概念:全局文件表 / 进程文件描述符等

  • 完成本章编程作业。

  • 最终,完成实验报告并 push 你的 ch6 分支到远程仓库。

编程作业

进程通信:邮箱

这一章我们实现了基于 pipe 的进程间通信,但是看测例就知道了,管道不太自由,我们来实现一套乍一看更靠谱的通信 syscall吧!本节要求实现邮箱机制,以及对应的 syscall。

  • 邮箱说明:每个进程拥有唯一一个邮箱,基于“数据报”收发字节信息,利用环形buffer存储,读写顺序为 FIFO,不记录来源进程。每次读写单位必须为一个报文,如果用于接收的缓冲区长度不够,舍弃超出的部分(截断报文)。为了简单,邮箱中最多拥有16条报文,每条报文最大长度256字节。当邮箱满时,发送邮件(也就是写邮箱会失败)。不考虑读写邮箱的权限,也就是所有进程都能够随意给其他进程的邮箱发报。

mailread:

  • syscall ID:401

  • C接口: int mailread(void* buf, int len)

  • Rust接口: fn mailread(buf: *mut u8, len: usize)

  • 功能:读取一个报文,如果成功返回报文长度.

  • 参数:
    • buf: 缓冲区头。

    • len:缓冲区长度。

  • 说明:
    • len > 256 按 256 处理,len < 队首报文长度且不为0,则截断报文。

    • len = 0,则不进行读取,如果没有报文读取,返回-1,否则返回0,这是用来测试是否有报文可读。

  • 可能的错误:
    • 邮箱空。

    • buf 无效。

mailwrite:

  • syscall ID:402

  • C接口: int mailwrite(int pid, void* buf, int len)

  • Rust接口: fn mailwrite(pid: usize, buf: *mut u8, len: usize)

  • 功能:向对应进程邮箱插入一条报文.

  • 参数:
    • pid: 目标进程id。

    • buf: 缓冲区头。

    • len:缓冲区长度。

  • 说明:
    • len > 256 按 256 处理,

    • len = 0,则不进行写入,如果邮箱满,返回-1,否则返回0,这是用来测试是否可以发报。

    • 可以向自己的邮箱写入报文。

  • 可能的错误:
    • 邮箱满。

    • buf 无效。

实现完成之后,你应该能通过 ch6_mail* 对应的所有测例,在 shell 中执行 ch6_usertest 来执行所有测试。

tips:

  • 给每个进程默认分配一个邮箱即可。

  • 邮箱的具体实现就是一个 ring buffer。

[挑战]进程通信:共享内存

如果你认为邮箱不够炫酷,可以试试这个。挑战内容,不占分,但你还是必须先实现 mail。

进程间通信(IPC)对于某些系统和应用其实十分重要,它被称为微内核的 Achilles tendon,同时在 android 应用中也十分常见,为此 android 系统专门设计了一套 binder 机制来加速 IPC 的效率。

最基础的 IPC 方式大致分两类:

  • 内核拷贝:指通过内核完成数据的拷贝,比如 pipe,邮箱。

  • 共享内存:直接将同一段物理内存映射到不同进程的虚存空间。

其中内核拷贝的方式一般效率较低,但安全可靠,容易同步。而共享内存的方式不需要内核参与,速度较快,但需要用户态自己想办法同步,同时可能会导致某些攻击,感兴趣的同学可以参考 TOCTTOU

框架实现的 pipe 属于第一类,那么现在我们来实现第二类。实现 share memory 的方法不止一种,这里我们拓展 ch4 实现的 mmap 的功能,利用 mmap 来实现共享内存。

mmap 系统调用新定义:

  • syscall ID: 222

  • 接口:int mmap(void* start, unsigned long long len, int port, int flag, int shmem_id)

  • 功能:当 flag 等于 0 时,功能与 ch4 时一致;当 flag = 1 时,视为申请共享内存(可类比 posix 接口的 MAP_SHARED 标志),这时需要根据 shmem_id 将对应的物理内存映射到 start 开始的虚存,内存页的属性为 prot。若此时 shmem_id 为 -1 时,视为需要申请一段新的物理内存作为共享内存使用; 若 shmem_id != -1,视作申请对应 id 的共享内存。

  • 参数:
    • start:需要映射的虚存起始地址。

    • len:映射字节长度,可以为 0 (如果是则直接返回),不可过大 (上限 1GiB )。

    • port:第 0 位表示是否可读,第 1 位表示是否可写,第 2 位表示是否可执行。其他位无效(必须为 0 )。

    • flag:申请内存的模式,为 0 时为申请物理内存,为 1 时为申请共享内存,其他值视作错误。

    • shmem_id:申请共享内存时使用,表示内核记录的一段共享内存的 id,该 id 全内核唯一(注意和 fd 的区别,fd 是 process 的属性, shmem_id 是全内核的属性)。

  • 返回值:
    • 若发生错误,返回 -1。

    • 若 flag == 0,返回值同 ch4。

    • 若 flag == 1,总返回映射的 shmem_id。

  • 说明:
    • 我们尚未有完整文件系统,所以这只是一个看上去像 posix 的 mmap 但实际不是的系统调用。

    • 我们不定义共享内存与 fork 的相互作用,不会加以测试,任何实现都可以。

    • 允许同一个进程将同一块共享内存映射到自己的不同虚存。

    • 为了简单,addr 要求按页对齐(否则报错),len 可直接按页上取整。

    • 为了简单,不考虑发生错误时的页回收(也就是内存泄漏)。

  • 错误:
    • [addr, addr + len) 存在已经被映射的页。

    • 物理内存不足。

    • port & !0x7 != 0 (port 其余位必须为0)。

    • port & 0x7 = 0 (这样的内存无意义)。

    • flag & ~0x1 != 0 (flag 应为 0 或 1)

    • shmem_id 无效。

munmap 系统调用定义:

  • syscall ID:215

  • C接口: int munmap(void* start, unsigned long long len)

  • Rust接口: fn munmap(start: usize, len: usize) -> i32

  • 功能:取消一块虚存的映射。

  • 参数:同 mmap

  • 说明:
    • 为了简单,参数错误时不考虑内存的恢复和回收。

  • 错误:
    • [start, start + len) 中存在未被映射的虚存。

正确实现后,你的 os 应该能够正确运行 ch6_shmem* 对应的一些测试用例,在 shell 中执行 ch6_usertest1 来执行测试。

tips:

  • QAQ,shmem 的企划被老师以太难为由毙掉了,所以就成了 challange…

  • 难受啊,这个唯一一个测例和参考实现都写好了的 challange …

问答作业

  1. 举出使用 pipe 的一个实际应用的例子。

tips: - 想想你平时咋使用 linux terminal 的? - 如何使用 cat 和 wc 完成一个文件的行数统计?

报告要求

注意目录要求,报告命名 ch6.pdf,位于 reports 目录下。 后续实验同理。

报告内容:

  • 注明姓名学号。

  • 完成 ch6 问答作业。

  • [可选,不占分]你对本次实验设计及难度的看法。