Програми копіювання файлів

Міністерство освіти і науки України

Житомирський державний технологічний університет

Лабораторна робота №1

з курсу «Системне програмування»

на тему: «Програми копіювання файлів»

м. Житомир 2011 р.

Зміст

1. Навчитися користуватись програмами copy1.exe та copy2.exe.

2. Розібрати роботу програм

2.1 Робота програми «COPY1.EXE»

2.2 Робота програми «COPY1.EXE»

3. Експерименти з «copy1.c»

4. Експерименти з «copy2.c»

Контрольні запитання

Висновок

Список використаної літератури

1. Навчитися користуватись програмами copy1.exe та copy2.exe

Програми «COPY1.С» та «COPY2.С» призначені для копіювання файлів. Програма «COPY1.С» використовує функції роботи з file handles, а «COPY2.С» - функції потокового вводу-виводу.

Для користування програмами:

    їх необхідно скомпілювати та отримати виконавчі файли «COPY1.EXE» та «COPY2.EXE»;

    запустити необхідну програму за допомогою командного рядка, ввівши відповідно "ім’я_прогрми" "файл_з_якого_копіювати" "файл_в_який_копіювати";

програма копіювання файл

2. Розібрати роботу програм

2.1 Робота програми «COPY1.EXE»

Підключаємо заголовочні файли для використання функцій та змінних:

#include <io.h> //open(), eof(), read(), write(), close()

#include <conio.h> //getch()

#include <stdio.h> //printf()

#include <stdlib.h> //exit()

#include <fcntl.h> //O_BINARY, O_RDONLY, O_WRONLY, O_CREAT, O_EXCL, O_TRUNC

#include <sys\types.h> //

#include <sys\stat.h> //S_IREAD, S_IWRITE

#include <alloc.h> //

#include <errno.h> //EEXIST

Макрос, що визначає розміру масиву

#define BUFSIZE 10000

Функція main() має два аргументи: цілочисельний аргумент argc який містить кількість аргументів у командному рядку та покажчик на масив покажчиків на рядки, де кожен вказує на певний аргумент командного рядка.

void main( int argc, char **argv ) {

Оголошуємо змінні:

int source, target;

int i;

char *buffer;

int count;

Перевіряємо чи правильна кількість аргументів у командному рядку. Якщо аргументів не три (програма, файл для копіювання, файл-копія), виводиться повідомлення про правильність заповнення командного рядка і виконання програми завершується.

if( argc != 3 ){

printf( "\n"

"Usage: COPY1 [d:][\\path]source_file [d:][\\path]target_file\n" );

getch();

exit( 1 );

}

Відкриваємо файл, який будемо копіювати за допомогою функції open(). Для цього передаємо в якості параметрів покажчик на імя файлу (argv[ 1 ]) та вказуємо типи доступу до файлу. O_BINARY - прапор доступу у бінарному режимі. O_RDONLY - прапор доступу до файлу "лише для читання". Функція open() у випадку успішного виконання повертає file handle і встановлює курсор на початок файлу, а у випадку помилки повертає -1 та встановлює errno в один із наступних станів: ENOENT, EMFILE, EACCES, EINVACC.

Даним if-ом перевіряємо успішність відкриття файлу, який варто копіювати.

if( ( source = open( argv[ 1 ], O_BINARY | O_RDONLY ) ) == -1 ) {

printf( "\nOpen source file error: %d", errno );

getch();

exit( 2 );

}

Відкриваємо файл, в який будемо копіювати за допомогою тієї ж функції open().

Прапор доступу до файлу встановлюємо в один із положень:

    O_BINARY - бінарний;

    O_WRONLY - для запису;

    O_CREAT - створюється;

    O_EXCL - перезаписується.

Прапор способу відкриття встановлюємо в один із положень:

    S_IREAD - може бути прочитаний;

    S_IWRITE - може бути записаний.

target = open( argv[ 2 ], O_BINARY | O_WRONLY | O_CREAT | O_EXCL,

S_IREAD | S_IWRITE );

Якщо при відкритті(створенні) файлу до якого буде відбуватися копіювання, errno дорівнює EEXIST (тобто файл з таким ім’ям вже існує), повідомити про існування файлу та запитати про необхідність його перезапису.

if( errno == EEXIST ) {

printf( "\nFile already exists. Overwrite? (Y/N)\n" );

i = getch();

if( ( i == 'y' ) || ( i == 'Y' ) )

target = open( argv[ 2 ], O_BINARY | O_WRONLY | O_CREAT | O_TRUNC,

S_IREAD | S_IWRITE );

}

Перевірити чи вдалося створити файл .

if( target == -1 ) {

printf( "\nOpen target file error: %d", errno );

getch();

exit( 2 );

}

Цілочисельній змінній count присвоїти значення макросу BUFSIZE.

count = BUFSIZE;

Виділити пам’ять на масив buffer розміром count, та перевірити чи пам’ять дійсно виділена.

if( ( buffer = ( char* )malloc( count ) ) == NULL ) {

printf( "\nNot enough memory" );

getch();

exit( 3 );

}

За допомогою оператора while, який буде виконуватися доти, доки функція eof() не знайде закінчення файлу, який копіюється, будемо виконувати читання та запис з вихідного файлу у вхідний.

while( !eof( source ) ) {

За допомогою функції read() зчитаємо із файлу source до масиву buffer count байтів.

if( ( count = read( source, buffer, count ) ) == -1 ) {

printf( "\nRead file error: %d", errno );

getch();

exit( 4 );

}

За допомогою функції write() запишемо до файлу target із масиву buffer count байтів.

if( ( count = write( target, buffer, count ) ) == -1 ) {

printf( "\nWrite file error: %d", errno );

getch();

exit( 5 );

}

}

Закриємо відкриті файли та звільнимо пам’ять із буферу.

close( source );

close( target );

free( buffer );

Проінформуємо про успішне копіювання.

printf("File copy...");

getch();

}

2.2 Робота програми «COPY1.EXE»

Підключаємо заголовочні файли для використання функцій та змінних:

#include <stdio.h>

#include <stdlib.h>

#include <time.h>

Оголошуємо прототип функції

void filecpy( FILE *stream_from, FILE *stream_to );

Оголошуємо два символьних масиви розміром BUFSIZ*10;

char buf1[ BUFSIZ * 10 ];

char buf2[ BUFSIZ * 10 ];

Функція main() має два аргументи: цілочисельний аргумент argc який містить кількість аргументів у командному рядку та покажчик на масив покажчиків на рядки, де кожен вказує на певний аргумент командного рядка.

void main( int argc, char *argv[] ) {

Оголосимо змінні:

time_t start, end;

FILE *stream_from, *stream_to;

Перевіряємо чи правильна кількість аргументів у командному рядку. Якщо аргументів не три (програма, файл для копіювання, файл-копія), виводиться повідомлення про правильність заповнення командного рядка і виконання програми завершується.

if( argc < 3 ) {

printf( "\nUsage:"

" COPY2 [d:][\\path]source_file [d:][\\path]target_file\n" );

exit( 1 );

}

Відкриваємо файл, який варто копіювати, для читання.

if( ( stream_from = fopen( argv[ 1 ], "rt" ) ) == NULL ) {

printf( "\nOpen source file error: %d", errno );

exit( 1 );

}

Відкриваємо файл, в який варто копіювати, для запису(якщо файлу не існує, він створюється, якщо існує - перезаписується).

stream_to = fopen( argv[ 2 ], "wt+" );

Вмикаємо тактовий лічильник, і його стартове значення присвоюємо змінній start.

start = clock();

Викликаємо функцію для копіювання і передаємо їй покажчик на файл який варто копіювати і на файл до якого необхідно копіювати.

filecpy( stream_from, stream_to );

Вимикаємо тактовий лічильник, і його фінальне значення присвоюємо змінній end.

end = clock();

Друкуємо інформацію про затрачений час на виконання функції і про розмір буферу який довелося використати.

printf( "Copying time is %5.1f. Buffer size is %d bytes\n",

( ( float )end - start ) / CLK_TCK, BUFSIZ );

Відкриваємо файл, який варто копіювати, та файл до якого варто копіювати.

if( ( stream_from = fopen( argv[ 1 ], "rt") ) == NULL )

exit( 1 );

stream_to = fopen( argv[ 2 ], "wt+" );

Задаємо буфери за допомогою функції setvbuf(), які будуть використовуватися у якості буферів потоків для операцій вводу/виводу. Причому для буферизації будемо використовувати повний об’єм буфера, оскільки використовується режим _IOFBF.

setvbuf( stream_from, buf1, _IOFBF, sizeof( buf1 ) );

setvbuf( stream_to, buf2, _IOFBF, sizeof( buf2 ) );

Викликаємо функцію для копіювання, при цьому підраховуємо затрачений на її виклик час та використану пам'ять.

start = clock();

filecpy( stream_from, stream_to );

end = clock();

printf( "Copying time is %5.1f. Buffer size is %d bytes\n",

( ( float )end - start ) / CLK_TCK, BUFSIZ * 10 );

Відкриваємо файл, який варто копіювати, та файл до якого варто копіювати.

if( ( stream_from = fopen( argv[ 1 ], "rt") ) == NULL )

exit( 1 );

stream_to = fopen( argv[ 2 ], "wt+" );

Задаємо буфери. Але потіки не буферизується, оскільки використовується режим _IONBF.

setvbuf( stream_from, NULL, _IONBF, 0 );

setvbuf( stream_to, NULL, _IONBF, 0 );

Викликаємо функцію для копіювання, при цьому підраховуємо затрачений на її виклик час та використану пам'ять.

start = clock();

filecpy( stream_from, stream_to );

end = clock();

printf( "Copying time is %5.1f. Buffers is not used\n",

( ( float )end - start ) / CLK_TCK );

exit( 0 );

}

Функція копіювання файлів з використанням потоку вводу/виводу.

Аргументи: FILE *stream_from - покажчик на потік звідки копіювати;

FILE *stream_to - покажчик на потік в який копіювати;

Функція нічого не повертає і не використовує глобальних змінних.

void filecpy( FILE *stream_from, FILE *stream_to ) {

Оголошуємо символьний масив на 256 знаків

char linebuf[ 256 ];

За допомогою оператора while та функції feof() шукаємо кінець потоку з якого копіюємо.

while( !feof( stream_from ) ) {

Використовуючи функцію fgets(), до масиву linebuf заносимо значенням із вихідного потоку stream_from.

if( fgets( linebuf, 255, stream_from ) == NULL ) break;

Використовуючи функцію fputs(), із масив linebuf виштовхуємо значенням до вхідного потоку stream_to.

if( fputs( linebuf, stream_to ) == EOF ) break;

}

Закриваємо файли.

fclose( stream_from );

fclose( stream_to );

}

3. Експерименти з «copy1.c»

В програмі copy1.c замінити бінарний режим доступу до обох файлів на текстовий і запустити програму для копіювання досить великого бінарного файлу. Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту

При зміні з бінарного режиму доступу до обох файлів на текстовий відбувається не повне копіювання (створений файл менший), а лише до символу Ctrl-Z (ASCII 1Ah), адже вважається, що досягнуто кінець файлу (умова EOF).

В програмі copy1.c замінити бінарний режим доступу до файлу, який записується, на текстовий і запустити програму. Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту.

При зміні з бінарного режиму доступу до файлу, який записується, на текстовий створюється не достовірна копія (створений файл більший), оскільки відбувається відображення кожного символу який був зчитаний у бінарному режимі. Таким чином пара, наприклад, символів CR LF не перетворюється в один символ нового рядка “\n”, а виводиться окремо як два символи.

4. Експерименти з «copy2.c»

В програмі copy2.c знайти оптимальний розмір буферу. Обґрунтувати вибір.

На мою думку, оптимальним розміром буферу буде розмір кратний числу 512. Це можна поясноит тим, що функція дає виграш в продуктивності при перенесенні відразу цілої групи байтів (блоку) за одне звернення до функції. Максимальний виграш досягається тоді, коли розмір блоку який переноситься з програми в файл кратний розміру сектора диску, а саме 512 байт.

В програмі copy2.c модифікувати програму так, щоб вона виводила на екран вміст файлу за допомогою функцій puts(), fputs(), printf(), fwrite(). Результати експерименту зафіксувати в зошиті. Пояснити причину ефекту.

При використанні функцій виведення на екран, відбувається виведення не екран інформації з вихідного файлу у тому вигляді, який передбачений відповідною функцією. При цьому затрачається більше часу на виконання програми.

Контрольні запитання

      Чим відрізняється текстовий режим доступу до файлу від бінарного?

Як для потокових так і для префіксних функцій файлового введення-виведення можливі два різних режими доступу до файлу: текстовий та бінарний. В текстовому режимі виконується трансляція символів CR LF (0Dh 0Ah). При читанні інформації з файлу в цьому режимі пара символів CR LF перетворюється в один символ нового рядка “\n” а при записі   символ нового рядка перетворюється в пару символів CR LF. Крім того, як тільки з файлу зчитується символ Ctrl-Z (ASCII 1Ah), вважається, що досягнуто кінець файлу (умова EOF). Таким чином, в текстовому режимі не вдається прочитати інформацію, розташовану після символу Ctrl-Z. При виконанні файлового введення-виведення в бінарному режимі жодного перетворення символів не відбувається, а всі вони розглядаються як такі що не мають якогось особливого сенсу. Режим доступу до файлу задається під час відкриття файлу через бібліотечну функцію відкриття або спеціальною зовнішньою змінною _fmode.

      Що таке дескриптор(handle) файлу?

Відкриття файлів виконує функція АН = 3Dh MS-DOS. Пара регістрів DS:DX вказує на ASCIIZ-рядок, що містить специфікацію файлу, що відкривається як регулярний, або ім’я драйверу символьного пристрою. В регістрі AL задається режим відкриття файлу. Значення яке повертається функцією в регістр АХ є ціле число, це префікс (handle) або дескриптор файлу. При всіх наступних операціях доступу до відкритого файлу в MS-DOS для ідентифікації файлу повідомляється тільки префікс.

    Чим відрізняється префіксний доступ до файлу від потокового?

Бібліотечні функції Turbo C для роботи з файлами можна поділити на дві групи: потокові та префіксні. Як потокові, так і префіксні функції звертаються, в принципі, до тих самих викликам функцій MS-DOS. Однак, потокові функції виконують додаткову буферизацію інформації. Це призводить до подвійної буферизації інформації: на рівні бібліотечної функції і на рівні MS-DOS. Префіксні функції не виконують додаткову буферизацію, а відразу звертаються до префіксних функцій MS-DOS.

    В яких випадках більше доцільний потоковий доступ? Чому?

Префіксні функції дають виграш в продуктивності при перенесенні відразу цілої групи байтів (блоку) за одне звернення до функції. Максимальний виграш досягається тоді, коли розмір блоку який переноситься з програми в файл кратний розміру сектора диску (512 байт). Перенесення інформації між файлом і Сі-програмою по символам або по рядкам виявляється більш ефективним при використанні функцій потокового файлового введення-виведення.

Висновок

Отже, при виконанні даної лабораторної роботи було використано дві програми копіювання файлів «COPY1.С» та «COPY2.С». Програма «COPY1.С» використовує функції роботи з file handles, а «COPY2.С» - функції потокового вводу-виводу. Було проведено повний розбір роботи обох кодів програм, їх тестування, модифікацію та оптимізацію.

Загалом у ході виконання лабораторної роботи були отримані всі необхідні знання та практичні навички для роботи з файлами.

Список використаної літератури

    Касаткін А.І. Управление ресурсами. - Минск: Вышейшая школа, 1992.

    Касаткін А.І. Системное программирование. - Минск: Вышейшая школа, 1991.

    Власенко О.В., Данильченко О.М., Северин О.О. Системне прогрмамування. Курс лекцій. Частина 1. (бібліотека ЖІТІ)