mmap 系统调用中 MAP_ANONYMOUS 标志的用途是什么?

What is the purpose of MAP_ANONYMOUS flag in mmap system call?

来自 man 页面,

MAP_ANONYMOUS
              The mapping is not backed by any file; its contents are initialized to zero.  The fd and offset arguments are ignored; however, some implementations  require
              fd  to  be  -1  if  MAP_ANONYMOUS  (or  MAP_ANON)  is  specified, and portable applications should ensure this.  The use of MAP_ANONYMOUS in conjunction with
              MAP_SHARED is only supported on Linux since kernel 2.4.

使用MAP_ANONYMOUS的目的是什么?任何例子都会很好。另外内存将从哪里映射?

man 页上写着 The use of MAP_ANONYMOUS in conjunction with MAP_SHARED is only supported on Linux since kernel 2.4. 我如何与其他进程共享使用 MAP_ANONYMOUS 映射的内存?

匿名映射可以被描绘成一个零化的虚拟文件。 匿名映射非常大,zero-filled 块内存可供使用。 这些映射驻留在堆之外,因此不会造成数据段碎片。

MAP_ANONYMOUS + MAP_PRIVATE:

  • 每次调用都会创建一个不同的映射
  • children 继承 parent 的映射
  • childrens 对继承映射的写入以 copy-on-write 方式满足
  • 使用这种映射的主要目的是分配一个新的归零内存
  • malloc 使用匿名私有映射来处理大于 MMAP_THRESHOLD 字节的内存分配请求。
    通常,MMAP_THRESHOLD 是 128kB。

MAP_ANONYMOUS + MAP_SHARED:

  • 每次调用都会创建一个不与任何其他映射共享页面的独特映射
  • children 继承 parent 的映射
  • 否 copy-on-write 当其他共享映射的人在共享映射上写入时
  • 共享匿名映射以类似于 System V 内存段的方式允许 IPC,但仅限于相关进程之间

在 Linux 上,有两种创建匿名映射的方法:

  • 指定 MAP_ANONYMOUS 标志并为 fd

    传递 -1
        addr = mmap(NULL, length, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0); 
        if (addr == MAP_FAILED)
            exit(EXIT_FAILURE);  
    
  • 打开/dev/zero并传递这个打开的fd

        fd = open("/dev/zero", O_RDWR);   
        addr = mmap(NULL, length, PROT_READ | PROT_WRITE, MAP_PRIVATE, fd, 0);
    

    (此方法通常用于 BSD 等没有 MAP_ANONYMOUS 标志的系统)

匿名映射的优点:
- 没有虚拟地址 space 碎片;取消映射后,内存立即归还给系统
- 它们在分配大小、权限方面是可修改的,它们也可以像普通映射一样接收建议
- 每个分配都是一个不同的映射,与全局堆分开

匿名映射的缺点:
- 每个映射的大小都是系统页面大小的整数倍,因此会导致地址浪费 space
- 创建和返回映射比 pre-allocated 堆

产生更多的开销

如果包含此类映射的程序派生一个进程,则 child 会继承该映射。 下面的程序演示了这种继承:

#ifdef USE_MAP_ANON
#define _BSD_SOURCE
#endif  
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <sys/wait.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
    /*Pointer to shared memory region*/    
    int *addr;   

#ifdef USE_MAP_ANON      /*Use MAP_ANONYMOUS*/           
     addr = mmap(NULL, sizeof(int), PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);     
     if (addr == MAP_FAILED) {     
         fprintf(stderr, "mmap() failed\n");     
         exit(EXIT_FAILURE);
     }      

#else        /*Map /dev/zero*/     
    int fd;    
    fd = open("/dev/zero", O_RDWR);      
    if (fd == -1) {    
        fprintf(stderr, "open() failed\n");
        exit(EXIT_FAILURE);
    }    

    addr = mmap(NULL, sizeof(int), PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);    
    if (addr == MAP_FAILED) {    
        fprintf(stderr, "mmap() failed\n");    
        exit(EXIT_FAILURE);    
    }     

    if (close(fd) == -1) {          /*No longer needed*/    
        fprintf(stderr, "close() failed\n");    
        exit(EXIT_FAILURE);    
    }
#endif    
    *addr = 1;      /*Initialize integer in mapped region*/    

    switch(fork()) {        /*Parent and child share mapping*/     
    case -1:    
        fprintf(stderr, "fork() failed\n");
        exit(EXIT_FAILURE);    

    case 0:         /*Child: increment shared integer and exit*/     
        printf("Child started, value = %d\n", *addr);    
        (*addr)++;    

        if (munmap(addr, sizeof(int)) == -1) {    
            fprintf(stderr, "munmap()() failed\n");    
            exit(EXIT_FAILURE);    
        }     
        exit(EXIT_SUCCESS);     

    default:        /*Parent: wait for child to terminate*/      
        if (wait(NULL) == -1) {    
            fprintf(stderr, "wait() failed\n");    
            exit(EXIT_FAILURE);      
        }     

        printf("In parent, value = %d\n", *addr);         
        if (munmap(addr, sizeof(int)) == -1) {       
            fprintf(stderr, "munmap()() failed\n");      
            exit(EXIT_FAILURE);       
        }        
        exit(EXIT_SUCCESS);
}

来源:
Linux 编程接口
第49章:内存映射,
作者:Michael Kerrisk

Linux系统编程(第3版)
第 8 章:内存管理,
作者:罗伯特·洛夫