奇怪的 mmap 行为

strange mmap behavior

我正在做一个实验,我有一个程序创建一个 16 字节的共享文件,然后每秒显示每个字节的值。

我希望能够在程序运行时更改文件 运行,并让程序识别更改。

程序似乎确实有写内存写文件的功能;但是如果我在运行时修改文件,尽管文件被更改,它仍继续使用旧值,并且文件停止更新。

这是无法识别更改的版本。

#include <stdio.h>
#include <stdint.h>
#include <string.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <unistd.h>
#include <signal.h>

// | bag of global state.
struct {
    uint8_t *state;
    char *filename;
    int length;
} global = {
    (uint8_t *)0,
    "state.bin",
    16
};

// | clean up when ctrl-c is pressed.
static void onSIGINT(int unused)
{
    puts("caught SIGINT; cleaning up.");
    munmap(global.state, global.length);
    unlink(global.filename);
    exit(0);
}

// | display each byte of global shared memory
static void inspect()
{
    int i;

    for (i = 0; i < global.length; ++i) {
        printf("state[%d] = %d.\n", i, global.state[i]);
    }
}

int main(int argc, char **argv)
{
    /* anonymous scope: initialize shared memory */
    {
        // | mmap arguments
        void *addr = (void *)0;
        int prot = PROT_READ | PROT_WRITE;
        int flags = MAP_SHARED;
        int offset = 0;
        int fd = open(global.filename, O_CREAT | O_RDWR, S_IRUSR | S_IWUSR);

        // | initialize memory to 16 zerod out bytes.
        uint8_t dummy[16];
        memset(&dummy, 0, global.length);
        write(fd, dummy, global.length);

        global.state = (uint8_t *)mmap (
            addr,
            global.length,
            prot,
            flags,
            fd,
            offset
        );

        if (global.state == MAP_FAILED) {
            close(fd);
            perror("could not create map.\n");
            unlink(global.filename);
        }                
    }

    signal(SIGINT, onSIGINT);

    /* anonymous scope: mainloop */
    {
        int count = 0;

        for (;;) {
            system("clear");
            printf("refresh number: %d.\n", count);
            ++count;
            inspect();
            sleep(1);
        }
    }

    return 0;
}

此版本还会在每次显示迭代时递增每个字节,以表明它实际上正在使用共享文件。

#include <stdio.h>
#include <stdint.h>
#include <string.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <unistd.h>
#include <signal.h>

// | bag of global state.
struct {
    uint8_t *state;
    char *filename;
    int length;
} global = {
    (uint8_t *)0,
    "state.bin",
    16
};

// | clean up when ctrl-c is pressed.
static void onSIGINT(int unused)
{
    puts("caught SIGINT; cleaning up.");
    munmap(global.state, global.length);
    unlink(global.filename);
    exit(0);
}

// | prints length bytes starting at address given.
static void inspect()
{
    int i;

    for (i = 0; i < global.length; ++i) {
        printf("state[%d] = %d.\n", i, global.state[i]);
        ++global.state[i];
    }
}

int main(int argc, char **argv)
{
    /* anonymous scope: initialize shared memory */
    {
        // | mmap arguments
        void *addr = (void *)0;
        int prot = PROT_READ | PROT_WRITE;
        int flags = MAP_SHARED;
        int offset = 0;
        int fd = open(global.filename, O_CREAT | O_RDWR, S_IRUSR | S_IWUSR);

        // | initialize memory to 16 zerod out bytes.
        uint8_t dummy[16];
        memset(&dummy, 0, global.length);
        write(fd, dummy, global.length);

        global.state = (uint8_t *)mmap (
            addr,
            global.length,
            prot,
            flags,
            fd,
            offset
        );

        if (global.state == MAP_FAILED) {
            close(fd);
            perror("could not create map.\n");
            unlink(global.filename);
        }                
    }

    signal(SIGINT, onSIGINT);

    /* anonymous scope: mainloop */
    {
        int count = 0;

        for (;;) {
            system("clear");
            printf("refresh number: %d.\n", count);
            ++count;
            inspect();
            sleep(1);
        }
    }

    return 0;
}

请注意,它成功地使每个字节递增,直到我更改 vim 中的一个字节为止。当我覆盖文件时,它会停止修改文件,但会继续从原来的位置开始计数。

为什么会这样;以及如何让它按预期运行?

这是由 vim 用于创建备份文件的方法引起的。这是为 backupcopy 选项记录的,典型的默认设置是重命名原始文件并编辑副本。这会导致内存映射视图与备份相关联,而不是与正在编辑的文件相关联。

如果您检查文件的索引节点,您可以看到这种情况:

$ echo z>a && ls -i a
14551885 a
$ vim a
$ ls -i a
14551887 a

如您所见,inode 现在不同了。例如,如果您使用 python 打开和修改文件,您可以就地编辑文件,它将按预期工作。

使用 python 的示例:

$ ls -i a
14551886 a
$ python
Python 2.7.6 (default, Oct 26 2016, 20:30:19)
[GCC 4.8.4] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> f = open('a', 'r+')
>>> f.write('22')
>>> f.close()
>>>

$ ls -i a
14551886 a