Читаем Linux API. Исчерпывающее руководство полностью

Для достижения высокой скорости и эффективности работы системные вызовы ввода-вывода (то есть ядро) и функции ввода-вывода стандартной библиотеки языка C (то есть функции stdio) при работе с дисковыми файлами осуществляют буферизацию данных. В этой главе мы рассмотрим оба типа буферизации, а также то, как они влияют на производительность приложения. Здесь также описаны различные приемы настройки и отключения обоих типов буферизации и техника, называемая непосредственным вводом-выводом, применяемая при определенных обстоятельствах, чтобы избежать буферизации при работе в режиме ядра.


13.1. Буферизация файлового ввода-вывода при работе в режиме ядра: буферная кэш-память


При работе с файлами на диске системные вызовы read() и write() не инициируют непосредственный доступ к диску. Вместо этого они просто копируют данные между буфером в пространстве памяти пользователя и буфером в буферном кэше ядра. Например, следующий вызов переносит 3 байта данных из буфера в пространстве памяти пользователя в буфер в пространстве ядра:

write(fd, "abc", 3);

Сразу после этого происходит возвращение из системного вызова write(). Несколько позже ядро записывает (сбрасывает) свой буфер на диск. (В связи с этим говорится, что системный вызов не синхронизирован с дисковой операцией.) Если в данном промежутке времени какой-нибудь другой процесс предпримет попытку чтения этих байтов файла, ядро автоматически предоставит данные из буферной кэш-памяти, а не из файла (с уже устаревшим содержимым).

Аналогично для ввода ядро считывает данные с диска и сохраняет их в буфере ядра. Вызовы read() извлекают данные из этого буфера, пока он не будет исчерпан, после чего ядро считывает следующий сегмент файла в буферную кэш-память. (Это несколько упрощенное представление происходящего. В режиме последовательного доступа к файлу ядро обычно выполняет упреждающее чтение, пытаясь обеспечить считывание в буферную кэш-память следующих блоков файла еще до того, как они будут востребованы считывающим процессом. Более подробно упреждающее чтение рассматривается в разделе 13.5.)

Замысел заключается в попытке ускорить работу read() и write(), чтобы им не приходилось находиться в режиме ожидания завершения относительно медленных дисковых операций. Кроме того, такая конструкция повышает эффективность работы за счет сокращения количества переносов данных с диска, которые ядро должно выполнить.

Ядро Linux не накладывает никаких фиксированных ограничений на размер буферной кэш-памяти. Оно выделит столько страниц буферной кэш-памяти, сколько понадобится, ограничившись при этом лишь объемом доступной физической памяти и потребностями в использовании физической памяти для других целей (например, для хранения текстовых страниц и страниц данных, требуемых выполняемым процессам). Если испытывается дефицит доступной памяти, ядро сбрасывает часть измененных страниц буферной кэш-памяти на диск с целью высвобождения этих страниц для их повторного использования.

Следует уточнить, что после выхода версии ядра 2.4 в Linux больше не создается отдельная буферная кэш-память. Вместо этого буферы файлового ввода-вывода включаются в страничную кэш-память, которая, к примеру, также содержит страницы из отображенных в памяти файлов. Тем не менее в изложении основного материала будет использоваться понятие буферной кэш-памяти, поскольку для реализаций UNIX оно более привычно.


Влияние размера буфера на производительность системных вызовов ввода-вывода

Независимо от того, выполняется 1000 записей одного байта или единая запись 1000 байт, ядро осуществляет одинаковое количество обращений к диску. Но последний вариант более предпочтителен, поскольку требует одного системного вызова, тогда как для первого варианта их требуется целая тысяча. Хотя системные вызовы выполняются намного быстрее дисковых операций, на них все же уходит довольно много времени, поскольку ядро должно системно перехватить вызов, проверить допустимость его аргументов и переместить данные между пространством пользователя и пространством ядра (подробности рассматриваются в разделе 3.1).

То, как размер буфера влияет на выполнение файлового ввода-вывода, можно проследить, запустив программу, показанную в листинге 4.1, с применением различных значений BUF_SIZE. (В константе BUF_SIZE указывается количество байтов, переносимых каждым вызовом read() и write().) Время, требуемое программе для копирования файла размером 100 миллионов байт в Linux в файловой системе ext2 с использованием различных значений BUF_SIZE, перечислено в табл. 13.1. В дополнение к приведенной в этой таблице информации нужно заметить следующее.

Перейти на страницу:

Похожие книги

C++ Primer Plus
C++ Primer Plus

C++ Primer Plus is a carefully crafted, complete tutorial on one of the most significant and widely used programming languages today. An accessible and easy-to-use self-study guide, this book is appropriate for both serious students of programming as well as developers already proficient in other languages.The sixth edition of C++ Primer Plus has been updated and expanded to cover the latest developments in C++, including a detailed look at the new C++11 standard.Author and educator Stephen Prata has created an introduction to C++ that is instructive, clear, and insightful. Fundamental programming concepts are explained along with details of the C++ language. Many short, practical examples illustrate just one or two concepts at a time, encouraging readers to master new topics by immediately putting them to use.Review questions and programming exercises at the end of each chapter help readers zero in on the most critical information and digest the most difficult concepts.In C++ Primer Plus, you'll find depth, breadth, and a variety of teaching techniques and tools to enhance your learning:• A new detailed chapter on the changes and additional capabilities introduced in the C++11 standard• Complete, integrated discussion of both basic C language and additional C++ features• Clear guidance about when and why to use a feature• Hands-on learning with concise and simple examples that develop your understanding a concept or two at a time• Hundreds of practical sample programs• Review questions and programming exercises at the end of each chapter to test your understanding• Coverage of generic C++ gives you the greatest possible flexibility• Teaches the ISO standard, including discussions of templates, the Standard Template Library, the string class, exceptions, RTTI, and namespaces

Стивен Прата

Программирование, программы, базы данных
1С: Бухгалтерия 8 с нуля
1С: Бухгалтерия 8 с нуля

Книга содержит полное описание приемов и методов работы с программой 1С:Бухгалтерия 8. Рассматривается автоматизация всех основных участков бухгалтерии: учет наличных и безналичных денежных средств, основных средств и НМА, прихода и расхода товарно-материальных ценностей, зарплаты, производства. Описано, как вводить исходные данные, заполнять справочники и каталоги, работать с первичными документами, проводить их по учету, формировать разнообразные отчеты, выводить данные на печать, настраивать программу и использовать ее сервисные функции. Каждый урок содержит подробное описание рассматриваемой темы с детальным разбором и иллюстрированием всех этапов.Для широкого круга пользователей.

Алексей Анатольевич Гладкий

Программирование, программы, базы данных / Программное обеспечение / Бухучет и аудит / Финансы и бизнес / Книги по IT / Словари и Энциклопедии
C# 4.0: полное руководство
C# 4.0: полное руководство

В этом полном руководстве по C# 4.0 - языку программирования, разработанному специально для среды .NET, - детально рассмотрены все основные средства языка: типы данных, операторы, управляющие операторы, классы, интерфейсы, методы, делегаты, индексаторы, события, указатели, обобщения, коллекции, основные библиотеки классов, средства многопоточного программирования и директивы препроцессора. Подробно описаны новые возможности C#, в том числе PLINQ, библиотека TPL, динамический тип данных, а также именованные и необязательные аргументы. Это справочное пособие снабжено массой полезных советов авторитетного автора и сотнями примеров программ с комментариями, благодаря которым они становятся понятными любому читателю независимо от уровня его подготовки. Книга рассчитана на широкий круг читателей, интересующихся программированием на C#.Введите сюда краткую аннотацию

Герберт Шилдт

Программирование, программы, базы данных