mkdirシステムコールコードを見つける

Ubuntuを初めて知ったときでも、このOSのカーネルがどのように機能するかに興味を持ちました。 私は真剣にそれを理解しようと決め、80メガバイトのソースアーカイブをダウンロードしました...それで終わりです! どこから始めればいいのか、どうやって終わればいいのか分かりませんでした。 ランダムなファイルを順番に開いて、すぐに迷子になりました。 これは経験豊富なLinuxoidで起こったと思います。 今、私は経験を得て、それを共有したいと思います。



この記事では、mkdirシステムコールコードを検索する方法について説明します。



まず、mkdir関数はsys/stat.h



定義されていsys/stat.h



プロトタイプは次のとおりです。



 /* Create a new directory named PATH, with permission bits MODE. */ extern int mkdir (__const char *__path, __mode_t __mode) __THROW __nonnull ((1));
      
      







このヘッダーファイルはPOSIX標準の一部です。 Linuxはほぼ完全にPOSIX互換です。つまり、その署名だけでmkdirを実装する必要があります。



しかし、署名を知っていても、実際のシステムコールコードを見つけるのは簡単ではありません...



そして実際には、 ack "int mkdir"



は以下を返します:



セキュリティ/ inode.c

103:static int mkdir(struct inode * dir、struct dentry * dentry、intモード)



tools / perf / util / util.c

4:int mkdir_p(char * path、mode_tモード)



tools / perf / util / util.h

259:int mkdir_p(char * path、mode_tモード);





単一の署名が完全に一致するわけではないことは明らかです。 mkdir関数の実装はどこにありますか? Linuxカーネルでシステムコールの実装を見つけるためのアルゴリズムは何ですか?



システムコールは通常の機能のようには機能しません。 より正確には、それらは機能ではありません。 システムコールを実行するには、いくつかのアセンブラーコードが必要です。 概して、システムコール番号はEAXレジスタに配置され(ちなみに、システムコールはアドレスではなく番号によってアクセスされます)、残りのレジスタは引数を配置します:最初はEBX、2番目はECX、3番目はEDX、4番目はESX EDIで5番目。 ところで、これがシステムコールが5つ以上の引数を持つことができない理由です。 必要な値がすべて見つかった後、システムコールを実行するプログラムは、128番目の割り込みを実行します(アセンブラー:int 0x80)。 割り込みは、プロセッサをカーネルモードにし、以前にカーネルと合意したアドレスに制御を移します。 ご覧のとおり、システムコールはC関数よりも低いレベルで動作します。



システムコールの番号はusr/include/asm*/unistd.h



ます:

 #define __NR_mkdir 83 __SYSCALL(__NR_mkdir, sys_mkdir)
      
      







つまり、mkdirシステムコールは83番です。



Linuxでユーザー空間にプログラムした場合、おそらく、C関数がシステムコールの作成に使用されることをご存じでしょう。 彼らはどこから来たのですか? これらの関数は、GNU libcライブラリの単なるラッパーです。 各システムコールにはラッパー関数があります。 関数自体はすべて同じ割り込みを実行します。



では、mkdirを今どこで探すべきでしょうか? 理論的には、システムコールは単にアセンブラで実装でき、対応するC関数は単に存在しませんが、そうではありません。 Linuxでは、すべてのシステムコールはinclude/linux/syscalls.h



定義されinclude/linux/syscalls.h





 asmlinkage long sys_mkdir(const char __user *pathname, int mode);
      
      







実装は、カーネルの対応する部分にあります。 ここでは、mkdirがVFSファイルサブシステムの一部であり、 fs/namei.c



定義されていることを知る必要があります。

 SYSCALL_DEFINE2(mkdir, const char __user *, pathname, umode_t, mode) { return sys_mkdirat(AT_FDCWD, pathname, mode); }
      
      







SYSCALL_DEFINE2はSYSCALL_DEFINExシリーズのマクロの1つです。xはシステムコールの引数の数です。 上記のコードでは、別のシステムコールはsys_mkdiratと呼ばれ、これもfs/namei.c



ます。 呼び出し元のコードはすでにカーネルモードで実行されているため、ここではシステムコールは関数を呼び出すことによって行われることに注意してください。



 SYSCALL_DEFINE3(mkdirat, int, dfd, const char __user *, pathname, umode_t, mode) { struct dentry *dentry; struct path path; int error; dentry = user_path_create(dfd, pathname, &path, 1); if (IS_ERR(dentry)) return PTR_ERR(dentry); if (!IS_POSIXACL(path.dentry->d_inode)) mode &= ~current_umask(); error = security_path_mkdir(&path, dentry, mode); if (!error) error = vfs_mkdir(path.dentry->d_inode, dentry, mode); done_path_create(&path, dentry); return error; }
      
      







そして、ここはすでに面白いです! 最初のチェックを満たし、別の関数vfs_mkdirに制御を移します。vfs_mkdirはすべて同じfs/namei.h



で定義されています



 int vfs_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode) { int error = may_create(dir, dentry); unsigned max_links = dir->i_sb->s_max_links; if (error) return error; if (!dir->i_op->mkdir) return -EPERM; mode &= (S_IRWXUGO|S_ISVTX); error = security_inode_mkdir(dir, dentry, mode); if (error) return error; if (max_links && dir->i_nlink >= max_links) return -EMLINK; error = dir->i_op->mkdir(dir, dentry, mode); if (!error) fsnotify_mkdir(dir, dentry); return error; }
      
      







別のチェック、別のコントロールの転送。 Linuxは非常にマルチレベルのシステムであり、システムのさまざまな部分に責任が分散していると言う価値があります。 したがって、上記のコードでロジックが常に委任されていることは不思議ではありません。 最後のコードでは、dir-> i_op-> mkdir(dir、dentry、mode)が呼び出されます。 トレイルに従ってください! dirはinode *型です。 iノード構造の定義から、i_opポインターはinode_operations *タイプであることがわかります。 最後の構造には、このノードで実行できる操作の機能へのポインターが含まれており、実装はファイルシステムごとに異なります。 つまり、dirが属するファイルシステムに応じて、inode_operations構造体には特定の実装へのポインタが含まれます。



たとえば、ext4の場合、fs / ext4 / namei.cにmkdirの実装があります。



実際に必要なコード!
 static int ext4_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode) { handle_t *handle; struct inode *inode; struct buffer_head *dir_block = NULL; struct ext4_dir_entry_2 *de; struct ext4_dir_entry_tail *t; unsigned int blocksize = dir->i_sb->s_blocksize; int csum_size = 0; int err, retries = 0; if (EXT4_HAS_RO_COMPAT_FEATURE(dir->i_sb, EXT4_FEATURE_RO_COMPAT_METADATA_CSUM)) csum_size = sizeof(struct ext4_dir_entry_tail); if (EXT4_DIR_LINK_MAX(dir)) return -EMLINK; dquot_initialize(dir); retry: handle = ext4_journal_start(dir, EXT4_DATA_TRANS_BLOCKS(dir->i_sb) + EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3 + EXT4_MAXQUOTAS_INIT_BLOCKS(dir->i_sb)); if (IS_ERR(handle)) return PTR_ERR(handle); if (IS_DIRSYNC(dir)) ext4_handle_sync(handle); inode = ext4_new_inode(handle, dir, S_IFDIR | mode, &dentry->d_name, 0, NULL); err = PTR_ERR(inode); if (IS_ERR(inode)) goto out_stop; inode->i_op = &ext4_dir_inode_operations; inode->i_fop = &ext4_dir_operations; inode->i_size = EXT4_I(inode)->i_disksize = inode->i_sb->s_blocksize; if (!(dir_block = ext4_bread(handle, inode, 0, 1, &err))) { if (!err) { err = -EIO; ext4_error(inode->i_sb, "Directory hole detected on inode %lu\n", inode->i_ino); } goto out_clear_inode; } BUFFER_TRACE(dir_block, "get_write_access"); err = ext4_journal_get_write_access(handle, dir_block); if (err) goto out_clear_inode; de = (struct ext4_dir_entry_2 *) dir_block->b_data; de->inode = cpu_to_le32(inode->i_ino); de->name_len = 1; de->rec_len = ext4_rec_len_to_disk(EXT4_DIR_REC_LEN(de->name_len), blocksize); strcpy(de->name, "."); ext4_set_de_type(dir->i_sb, de, S_IFDIR); de = ext4_next_entry(de, blocksize); de->inode = cpu_to_le32(dir->i_ino); de->rec_len = ext4_rec_len_to_disk(blocksize - (csum_size + EXT4_DIR_REC_LEN(1)), blocksize); de->name_len = 2; strcpy(de->name, ".."); ext4_set_de_type(dir->i_sb, de, S_IFDIR); set_nlink(inode, 2); if (csum_size) { t = EXT4_DIRENT_TAIL(dir_block->b_data, blocksize); initialize_dirent_tail(t, blocksize); } BUFFER_TRACE(dir_block, "call ext4_handle_dirty_metadata"); err = ext4_handle_dirty_dirent_node(handle, inode, dir_block); if (err) goto out_clear_inode; set_buffer_verified(dir_block); err = ext4_mark_inode_dirty(handle, inode); if (!err) err = ext4_add_entry(handle, dentry, inode); if (err) { out_clear_inode: clear_nlink(inode); unlock_new_inode(inode); ext4_mark_inode_dirty(handle, inode); iput(inode); goto out_stop; } ext4_inc_count(handle, dir); ext4_update_dx_flag(dir); err = ext4_mark_inode_dirty(handle, dir); if (err) goto out_clear_inode; unlock_new_inode(inode); d_instantiate(dentry, inode); out_stop: brelse(dir_block); ext4_journal_stop(handle); if (err == -ENOSPC && ext4_should_retry_alloc(dir->i_sb, &retries)) goto retry; return err; }
      
      







カーネルの動作を理解することは、Linuxoidの兵器庫で役立つスキルです。 この記事がお役に立てば幸いです!



リソース:

Linuxシステムコールテーブル

Linux 3.6ソース

unix.stackexchange.comでの議論



All Articles