Каким должен быть язык программирования?	Анализ и критика	Описание языка	Компилятор
Отечественные разработки	Cтатьи на компьютерные темы	Компьютерный юмор	Новости и прочее

Модификация исполняемого кода как способ реализации массивов с изменяемыми границами

Введение

Подход к реализации
Выделение памяти для массивов с «динамическими» границами
Обработка констант
Объекты программы, зависящие от размеров границ массивов
Синтаксис массивов с изменяемыми границами
Ссылка на массивы с изменяемыми границами
Пример использования «динамических» массивов как параметров
Заключение

Введение

«К вопросу о совершенствовании языка программирования»

Подход к реализации

dcl x(100,100) float(53);
dcl (i,j)      fixed(63);
...
x(i,j)=12345e0;

48693DB838010020030000   imul q rdi,I,800
48A1C038010000000000     mov  q rax,J
488DBCC710FDFFFF         lea    rdi,X+0FFFFFCD8h[rdi+rax*8]
BE30000000               mov  q rsi,offset @00000030h
48A5                     movsq

Выделение памяти для массивов с «динамическими» границами

«О размещении переменных в стеке»

Обработка констант

Объекты программы, зависящие от размеров границ массивов

встроенные функции языка LBOUND/HBOUND/DIMENSION, выдающие значения нижней/верхней границы или числа элементов для заданной размерности;
оператор ALLOCATE, неявно имеющий входным параметром число выделяемых массиву байт, зависящее от его границ;
«индекс», т.е. собственно команды вычисляющие часть адреса по очередному индексу-переменной при обращении к элементу массива;
«последний индекс», появляется только в случае режима компиляции с контролем выхода индекса за границы массива. Для данного элемента корректировать константу в команде не требуется, например, это случай одномерного массива, где вычисление адреса по единственному индексу не зависит от значения границ, но где-то далее имеются команды контроля выхода индекса за границы и их-то и необходимо скорректировать.
«смещение» массива, это последняя из команд вычисления адреса элемента массива. К этому моменту уже вычислены составляющие адреса от индексов-переменных и в этой команде для x86-64 обычно реализуется базово-индексный режим адресации, причем имеется и постоянное «смещение», которое как раз и зависит от значений границ и должно быть скорректировано. Смещение возникает, так как нижние границы не обязательно нулевые, некоторые индексы могут быть константами, а элемент, адрес которого вычисляется, сам может быть элементом «структуры» (агрегата разнотипных элементов), имеющим свое постоянное «смещение» внутри каждого элемента этой структуры;
«участок памяти» - при обращении к части массива или к массиву целиком как к непрерывному участку памяти необходимо скорректировать число обрабатываемых байт, так как оно также зависит от текущих значений границ.

Синтаксис массивов с изменяемыми границами

dcl  n      fixed(31),
     x(0:n) float ctl;
get list(n);
allocate x;
...

dcl  n      fixed(31),
     x(*)   float ctl;
get list(n);
?index(1,1)=0; ?index(1,2)=n; // устанавливаем новые границы
call ?ret(addr(x));           // меняем константы для массива x
allocate x;
...

dcl ?index(15,2) fixed(31) external;

dcl ?ret entry(ptr) external;

dcl // структура-массив с изменяемыми границами
1 s(*,*)       ctl,
 2 x1          char(100) var,
 2 y1 (-1:25)  float,
 2 z1 (100)    fixed(31);

Ссылка на массивы с изменяемыми границами

dcl x(100) float based(p1),
   (p1,p2) ptr;
p2=addr(x);     //это эквивалентно p2=p1;

call умножение_матриц(addr(a),addr(b),addr(c),m,n,q);

dcl умножение_матриц entry(ptr,ptr,ptr,fixed(31),fixed(31),fixed(31));

dcl x(*) float ctl,
    p1   ptr;
addr(x)=p1; //эквивалентно оператору <служебный указатель на x>=p1;

Пример использования «динамических» массивов как параметров

TEST:PROC MAIN;

DCL (A1,B1,C1)(*,*) FLOAT CTL; // ДИНАМИЧЕСКИЕ МАТРИЦЫ
DCL (M1,N1,Q1)      FIXED(31); // ЗАДАВАЕМЫЕ ГРАНИЦЫ
DCL (I,J)           FIXED(31); // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- ДЛЯ ТЕСТА ЗАДАЕМ НЕКОТОРЫЕ ЗНАЧЕНИЯ ГРАНИЦ ----

M1=5; N1=4; Q1=3;

//---- КОРРЕКТИРУЕМ КОНСТАНТЫ A1(M1,N1), B1(N1,Q1), C1(M1,Q1) ----

?INDEX(1,2)=M1; ?INDEX(2,2)=N1;
?RET(ADDR(A1));                   // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ A1
?INDEX(1,2)=N1; ?INDEX(2,2)=Q1;
?RET(ADDR(B1));                   // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ B1
?INDEX(1,2)=M1;
?RET(ADDR(C1));                   // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ C1

//---- СОЗДАЕМ МАТРИЦЫ A1(M1,N1), B1(N1,Q1) И C1(M1,Q1) ----

ALLOCATE A1,B1,C1;

//---- ДЛЯ ТЕСТА ЗАПОЛНЯЕМ МАТРИЦЫ НЕКОТОРЫМИ ЗНАЧЕНИЯМИ ----

DO I=1 TO M1; DO J=1 TO N1; A1(I,J)=I+J; END J; END I;
DO I=1 TO N1; DO J=1 TO Q1; B1(I,J)=I-J; END J; END I;

//---- УМНОЖЕНИЕ МАТРИЦ A1 И B1, РЕЗУЛЬТАТ - МАТРИЦА C1 ----

УМНОЖЕНИЕ_МАТРИЦ(ADDR(A1),ADDR(B1),ADDR(C1),M1,N1,Q1);

//---- ВЫДАЕМ ПОЛУЧЕННЫЙ РЕЗУЛЬТАТ ----

PUT SKIP DATA(C1);

FREE A1,B1,C1;

//========== УМНОЖЕНИЕ МАТРИЦ ЗАДАННОГО РАЗМЕРА ==========

УМНОЖЕНИЕ_МАТРИЦ:PROC(P1,P2,P3,M,N,Q);

//---- ВХОД A(M,N) И B(N,Q), ОТВЕТ - МАТРИЦА C(M,Q) ----

DCL (P1,P2,P3)   PTR;       // УКАЗАТЕЛИ НА МАТРИЦЫ
DCL (M,N,Q)      FIXED(31); // ЗАДАННЫЕ ГРАНИЦЫ
DCL (A,B,C)(*,*) FLOAT CTL; // ДИНАМИЧЕСКИЕ МАТРИЦЫ
DCL (I,J,K)      FIXED(31); // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- НОВЫЕ ОПЕРАТОРЫ ПРИСВАИВАНИЯ УКАЗАТЕЛЕЙ ----

ADDR(A)=P1;     // АДРЕС ДЛЯ МАССИВА A
ADDR(B)=P2;     // АДРЕС ДЛЯ МАССИВА B
ADDR(C)=P3;     // АДРЕС ДЛЯ МАССИВА C

//---- КОРРЕКТИРУЕМ КОНСТАНТЫ МАТРИЦ A(M,N), B(N,Q), C(M,Q) ----

?INDEX(1,2)=M; ?INDEX(2,2)=N;
?RET(ADDR(A));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ A
?INDEX(1,2)=N; ?INDEX(2,2)=Q;
?RET(ADDR(B));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ B
?INDEX(1,2)=M;
?RET(ADDR(C));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ C

//---- УМНОЖЕНИЕ МАТРИЦ ----

DO I=1 TO M;
   DO J=1 TO Q;
          C(I,J)=0;
          DO K=1 TO N;
                 C(I,J)+=A(I,K)*B(K,J);
          END K;
   END J;
END I;
END УМНОЖЕНИЕ_МАТРИЦ;
END TEST;

TEST:PROC MAIN;

DCL (P1,P2,P3)      PTR;             // УКАЗАТЕЛИ НА МАТРИЦЫ
DCL A1(5,4)         FLOAT BASED(P1), // СТАТИЧЕСКАЯ МАТРИЦА А1
    B1(4,3)         FLOAT BASED(P2), // СТАТИЧЕСКАЯ МАТРИЦА B1
    C1(5,3)         FLOAT BASED(P3); // СТАТИЧЕСКАЯ МАТРИЦА C1
DCL (M1,N1,Q1)      FIXED(31);       // ЗАДАВАЕМЫЕ ГРАНИЦЫ
DCL (I,J)           FIXED(31);       // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- ДЛЯ ТЕСТА ЗАДАЕМ НЕКОТОРЫЕ ЗНАЧЕНИЯ ГРАНИЦ ----

M1=5; N1=4; Q1=3;

//---- СОЗДАЕМ МАТРИЦЫ A1(M1,N1), B1(N1,Q1) C1(M1,Q1) ----

ALLOCATE A1,B1,C1;

//---- ДЛЯ ТЕСТА ЗАПОЛНЯЕМ МАТРИЦЫ НЕКОТОРЫМИ ЗНАЧЕНИЯМИ ----

DO I=1 TO M1; DO J=1 TO N1; A1(I,J)=I+J; END J; END I;
DO I=1 TO N1; DO J=1 TO Q1; B1(I,J)=I-J; END J; END I;

//---- УМНОЖЕНИЕ МАТРИЦ A1 И B1, РЕЗУЛЬТАТ - МАТРИЦА C1 ----

УМНОЖЕНИЕ_МАТРИЦ(ADDR(A1),ADDR(B1),ADDR(C1),M1,N1,Q1);

//---- ВЫДАЕМ ПОЛУЧЕННЫЙ РЕЗУЛЬТАТ ----

PUT SKIP DATA(C1);

FREE A1,B1,C1;

//========== УМНОЖЕНИЕ МАТРИЦ ЗАДАННОГО РАЗМЕРА ==========

УМНОЖЕНИЕ_МАТРИЦ:PROC(P1,P2,P3,M,N,Q);

//---- ВХОД A(M,N) И B(N,Q), ОТВЕТ - МАТРИЦА C(M,Q) ----

DCL (P1,P2,P3)   PTR;             // УКАЗАТЕЛИ НА МАТРИЦЫ
DCL (M,N,Q)      FIXED(31);       // ЗАДАННЫЕ ГРАНИЦЫ
DCL A(5,4)       FLOAT BASED(P1), // СТАТИЧЕСКИЕ МАТРИЦЫ
    B(4,3)       FLOAT BASED(P2),
    C(5,3)       FLOAT BASED(P3);
DCL (I,J,K)      FIXED(31);       // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- УМНОЖЕНИЕ МАТРИЦ ----

DO I=1 TO M;
   DO J=1 TO Q;
          C(I,J)=0;
          DO K=1 TO N;
                 C(I,J)+=A(I,K)*B(K,J);
          END K;
   END J;
END I;
END УМНОЖЕНИЕ_МАТРИЦ;
END TEST;

C1(1,1)=  2.600000E+01 C1(1,2)=  1.200000E+01 C1(1,3)= -2.000000E+00
C1(2,1)=  3.200000E+01 C1(2,2)=  1.400000E+01 C1(2,3)= -4.000000E+00
C1(3,1)=  3.800000E+01 C1(3,2)=  1.600000E+01 C1(3,3)= -6.000000E+00
C1(4,1)=  4.400000E+01 C1(4,2)=  1.800000E+01 C1(4,3)= -8.000000E+00
C1(5,1)=  5.000000E+01 C1(5,2)=  2.000000E+01 C1(5,3)= -1.000000E+01

Заключение

Автор: Д.Ю.Караваев. 15.10.2019

Опубликовано: 2019.09.12, последняя правка: 2019.11.25 20:31

Оцените	Оценки посетителей
Нравится	███████████████ 5 (35.7%)
Неплохо	█████████ 3 (21.4%)
Так себе	██████ 2 (14.2%)
Не нравится	████████████ 4 (28.5%)

Отзывы

✅ 2019/09/13 13:59, Автор сайта #0

Если границы массивов, а, значит, и объем занимаемой памяти, меняются во время исполнения программы, то в общем случае такие массивы не могут размещаться в «статической» памяти.

Поэтому память для массивов с «динамическими» границами должен явно выделять программист из «кучи» оператором ALLOCATE и освобождать оператором FREE.

«Размещение объектов переменной длины с использованием двух стеков»

«Реализация двухстековой модели размещения данных»

✅ 2019/09/13 14:07, kt #1

границы массива меняются уже после его создания? Или после создания границы массива «затвердевают»?

✅ 2019/09/13 16:35, Автор сайта #2

Разумеется, границы должны быть изменены ДО создания.

✅ 2019/09/13 18:16, MihalNik #3

Ну тогда двухстековая система это точно выдержит.

Так free никуда не денется. Реальные массивы данных надо загружать/выгружать в произвольной очередности, стековая, когда функция получила данные, переработала и освободила память — подходит не всегда. Никто же, например, не закрывает вкладки в читалке/редакторе/браузере строго в обратном порядке.

✅ 2019/09/13 22:15, kt #4

Тут хотелось бы каких-то замеров.

mov  q rdi,P
imul q rax,I,800
add  q rdi,rax
mov  q rax,J
lea    rdi,0FFFFFCD8h[rdi+rax*8] ; начало X(I,J)

mov  q rdi,P
mov rax,[rdi]-16   ;верхняя граница 2
sub rax,[rdi]-8    ;нижняя граница 2
add rax,1
add rax,J          ;младший индекс
shl rax,3          ;умножаем число элементов на 8 байт
mov rbx,[rdi]-32   ;верхняя граница 1
sub rbx,[rdi]-24   ;нижняя граница 1
add rbx,1
add rbx,I          ;старший индекс
imul rbx           ;умножаем число элементов на размерность
lea rdi,[rdi+rbx]  ;начало X(I,J)

✅ 2019/10/10 20:52, kt #5

Уважаемый автор!
Ваша статья не была рекомендована нашими рецензентами для публикации в журнале "Программирование". Вот общий комментарий, поступивший от них:
Статья описывает механизм генерации кода для динамически изменяемых границ массива для языка PL/I. Механизм динамического изменения кода многократно
обкатан в JIT-компиляторах и системах исправления ошибок на лету (dynamic patching), там это обычно применяется для обеспечения безопасности. Неясна новизна статьи: сам по себе подход известен, а его детали в PL/I не будут интересны читателям журнала из-за низкой актуальности использования этого языка.
С уважением,
ответственный секретарь редакционной коллегии журнала "Программирование"
д.т.н. Л. Е. Карпов

✅ 2019/10/11 07:31, utkin #6

Первое — есть концепция разрежённого массива, которая решает данную задачу в общем виде (то есть там нет ориентации на скорость, есть класс задач, который может быть решен эффективно). Пример разрежённого массива — это бесконечная таблица в Экселе. В общем виде разрежённые массивы могут расти в обе стороны. Реализация строго куча, никаких стеков.
Второе — что значит затвердевание границы? Я снова обращаюсь к живому примеру — электронной таблице. Как бы Вы построили программу с использованием предлагаемой технологии?
Третье — массивы создавались для того, чтобы избавиться от указателей, а не для того, чтобы ещё больше использовать их.

✅ 2019/10/11 13:55, Автор сайта #7

kt
программирование — это и практическая деятельность, а в журнале с таким названием полно заумных статей, которые нужны лишь для зачета публикаций авторам.

Неясна новизна статьи

utkin
концепция разрежённого массива ... решает данную задачу в общем виде.

✅ 2019/10/11 12:59, kt #8

VIT1972

theriodont

✅ 2019/10/11 13:36, kt #9

✅ 2019/10/12 16:11, Comdiv #10

✅ 2019/10/12 18:47, kt #11

✅ 2019/10/12 20:43, Comdiv #12

✅ 2019/10/12 21:48, kt #13

✅ 2019/10/12 23:42, Comdiv #14

#include <stdlib.h>
#include <stdio.h>

#if !defined(CONST_BOUNDS)
#   define CONST_BOUNDS (0>1)
#endif

#if defined(M) && defined(N) && defined(Q)
//  здесь три точки без пробелов, но это сочетание приводит к проблемам отображения на этом сайте
#   define BOUNDS(...)
#else
#   define BOUNDS(...) __VA_ARGS__
#endif

static void mul(BOUNDS(int M, int N, int Q,)
                float const a[M][N], float const b[N][Q],
                float c[M][Q])
{
    for (int i = 0; i < M; i += 1) {
        for (int j = 0; j < Q; j += 1) {
            c[i][j] = 0.0;
            for (int k = 0; k < N; k += 1) {
                c[i][j] += a[i][k] * b[k][j];
            }
        }
    }
}

static void init(BOUNDS(int M, int N, int Q,)
                 float a[M][N], float b[N][Q])
{
    for (int i = 0; i < M; i += 1) {
        for (int j = 0; j < N; j += 1) {
            a[i][j] = i + j + 2;
        }
    }
    for (int i = 0; i < N; i += 1) {
        for (int j = 0; j < Q; j += 1) {
            b[i][j] = i — j;
        }
    }
}

static void printMatrix(BOUNDS(int M, int Q,) float c[M][Q]) {
    for (int i = 0; i < M; i += 1) {
        for (int j = 0; j < Q; j += 1) {
            printf("%g ", c[i][j]);
        }
        printf("\n");
    }
}

static float sumAll(BOUNDS(int M, int Q,) float c[M][Q]) {
    float sum;
    sum = 0;
    for (int i = 0; i < M; i += 1) {
        for (int j = 0; j < Q; j += 1) {
            sum += c[i][j];
        }
    }
    return sum;
}

static void run(BOUNDS(int M, int N, int Q)) {
    float (*a)[M][N], (*b)[N][Q], (*c)[M][Q];
    a = malloc(sizeof(*a));
    b = malloc(sizeof(*b));
    c = malloc(sizeof(*c));
    init(BOUNDS(M, N, Q,) *a, *b);
    mul(BOUNDS(M, N, Q,) *a, *b, *c);
    if (M * Q < 65) {
        printMatrix(BOUNDS(M, Q,) *c);
    } else {
        printf("%g\n", sumAll(BOUNDS(M, Q,) *c));
    }
    free(a);
    free(b);
    free(c);
}

int main(int argc, char *argv[]) {
    run(BOUNDS(atoi(argv[1]), atoi(argv[2]), atoi(argv[3])));
    return 0;
}


23:34:09 matrix: # динамические границы
23:34:27 matrix: gcc mulma.c -o mulma -O1
23:34:38 matrix: time ./mulma 2000 1500 1000
1.87575e+15

real	0m19,363s
23:35:14 matrix: # динамические границы с контролем границ массива
23:35:32 matrix: gcc mulma.c -o mulma -O1 -fsanitize=undefined -fsanitize-undefined-trap-on-error
23:35:43 matrix: time ./mulma 2000 1500 1000
1.87575e+15

real	0m20,990s
23:36:06 matrix: # статические границы
23:36:23 matrix: gcc mulma.c -o mulma -DM=2000 -DN=1500 -DQ=1000 -O1
23:36:44 matrix: time ./mulma
1.87575e+15

real	0m19,410s
23:37:13 matrix: gcc mulma.c -o mulma -DM=2000 -DN=1500 -DQ=1000 -O3
23:37:18 matrix: time ./mulma
1.87575e+15

real	0m5,146s
23:37:28 matrix: gcc mulma.c -o mulma -O3
23:37:59 matrix: time ./mulma 2000 1500 1000
1.87575e+15

real	0m19,298s

✅ 2019/10/13 10:39, kt #15

из-под WINE падает, наверно, из-за динамических правок кода

✅ 2019/10/13 18:23, Comdiv #16

Надеюсь, таблицу адресов А5.ТХТ не забыли скачать и переименовать?

START=  9.71444508209000E+008
?STIME=  9.71444533775000E+008 ?STIME-START=  2.55659999847412E+001

Похоже, кроме одного режима оптимизации, "статичность" границ вообще не учитывается.

18:00:06 matrix: gcc mulma.c -o mulma
18:00:50 matrix: time ./mulma 2000 1500 1000
1.87575e+15

real	0m24,745s
18:01:19 matrix: gcc mulma.c -o mulma -DM=2000 -DN=1500 -DQ=1000
18:01:29 matrix: time ./mulma
1.87575e+15

real	0m23,191s

✅ 2019/10/13 19:02, kt #17

imul rdi,I,800

✅ 2019/10/13 20:16, Comdiv #18

Только обратите внимание, что данный пример был простейший(и хорошо оптимизируемый)

Данный способ вполне может использоваться совместно с другой оптимизацией, а не вместо нее. И тогда выигрыш был бы ещё больше.

✅ 2019/10/13 21:34, kt #19

Слишком частные случаи погоды не сделают. Для того, чтобы применить такую оптимизацию для более общего случая необходимо, на мой взгляд, существенно усложнить транслятор.

Кстати, какой выигрыш в этом примере получился на Вашем трансляторе?

✅ 2019/10/13 21:44, Comdiv #20

Нет, транслятор практически не усложняется

✅ 2019/10/13 22:00, Comdiv #21

✅ 2019/10/13 22:56, kt #22

Тело подпрограммы переписывается каждый раз при вызове?

Это означает, что в некоторых случаях это будет приводить наоборот, к замедлению.

Как будет вести себя программа со списком массивов, к примеру?

Честных именованных констант тоже нет?

✅ 2019/10/14 00:26, Comdiv #23

Попробуйте добавить в тесты печать индексов I,J,K (например, при ошибке) и посмотрите на время выполнения.

gcc mulma.c -o mulma -O1 -fsanitize=undefined -fsanitize-undefined-trap-on-error

В PL/1-KT есть оператор %replace. Зачем затенять пример посторонними вещами?

В примере меняется десяток констант, а затем идут миллионы обращений к массивам. Потери на корректировку малы.

PROCEDURE Do(a: ARRAY OF POINTER TO ARRAY *,* OF INTEGER; y,j,k: INTEGER): INTEGER;
RETURN a[y][j][k]
END Do;

✅ 2019/10/14 10:05, kt #24

Do:PROCEDURE (p,x,y,j,k) RETURNS(FIXED(*));
DCL 
p           PTR,
(x,y,j,k)   FIXED(*),
1 a(*), 
 2 a1       PTR CTL,
 2 x1,x2)   FIXED(*),
b(*,*)      FIXED(*) CTL;

ADDR(a)=p;
?INDEX(1,1)=1;     ?INDEX(1,2)=x;    ?RET(ADDR(a));
ADDR(b)=a1(y);
?INDEX(1,1)=x1(y); ?INDEX(1,2)=x2(y);?RET(ADDR(b));
RETURN (b(j,k));
END Do;

✅ 2019/10/14 12:56, Comdiv #25

Я имел ввиду, что в простых случаях оптимизатор не вставляет реальные команды контроля индексов. Но если есть операторы вывода индексов — их придется заполнять и время увеличится.

✅ 2019/10/14 13:41, kt #26

✅ 2019/10/14 18:52, Comdiv #27

А зачем?

А, может, когда действительно по-разному, то и результат — в 4 раза быстрее по Вашим же данным.

✅ 2019/10/14 22:08, kt #28


//---- САМО УМНОЖЕНИЕ ----
DO I=1 TO M;
48C7051802000001000000      mov  q I,1
488B3D00020000              mov  q rdi,M
486307                      movsxq rax,[rdi]
48A36002000000000000        mov  q @00000260h,rax
                        @18:
48A16002000000000000        mov  q rax,@00000260h
48390518020000              cmp  q I,rax
0F8F00000000                jg     @19
   DO J=1 TO Q;
48C7052002000001000000      mov  q J,1
488B3D10020000              mov  q rdi,Q
486307                      movsxq rax,[rdi]
48A36802000000000000        mov  q @00000268h,rax
                        @20:
48A16802000000000000        mov  q rax,@00000268h
48390520020000              cmp  q J,rax
0F8F00000000                jg     @21
      C(I,J)=0;
488B3DB0000000              mov  q rdi,?P0006
48690518020000E4030000      imul q rax,I,996
4803F8                      add  q rdi,rax
48A12002000000000000        mov  q rax,J
488DBC87D8DCFFFF            lea    rdi,0FFFFDCD8h[rdi+rax*4]
BE10010000                  mov  q rsi,offset @00000110h
A5                          movs
      DO K=1 TO N;
48C7052802000001000000      mov  q K,1
488B1D08020000              mov  q rbx,N
486303                      movsxq rax,[rbx]
48A37002000000000000        mov  q @00000270h,rax
                        @22:
48A17002000000000000        mov  q rax,@00000270h
48390528020000              cmp  q K,rax
0F8FC0000000                jg     @23
         C(I,J)+=A(I,K)*B(K,J);
488B3DC0000000              mov  q rdi,?P0004
48690518020000E4030000      imul q rax,I,996
4803F8                      add  q rdi,rax
48A12802000000000000        mov  q rax,K
48C1E002                    shl  q rax,2
4803F8                      add  q rdi,rax
488B35B8000000              mov  q rsi,?P0005
48690528020000E4030000      imul q rax,K,996
4803F0                      add  q rsi,rax
48A12002000000000000        mov  q rax,J
488D9C86D8DCFFFF            lea    rbx,0FFFFDCD8h[rsi+rax*4]
488D97D8DCFFFF              lea    rdx,0FFFFDCD8h[rdi]
F8                          clc
D903                        FLD32  [RBX]
53                          PUSH   RBX
D80A                        FMUL32 [RDX]
D91C24                      FST32P [RSP]
488B3DB0000000              mov  q rdi,?P0006
48690518020000E4030000      imul q rax,I,996
4803F8                      add  q rdi,rax
48A12002000000000000        mov  q rax,J
488D9C87D8DCFFFF            lea    rbx,0FFFFDCD8h[rdi+rax*4]
F8                          clc
D90424                      FLD32  [RSP]
D803                        FADD32 [RBX]
58                          POP    RAX
488B3DB0000000              mov  q rdi,?P0006
48690518020000E4030000      imul q rax,I,996
4803F8                      add  q rdi,rax
48A12002000000000000        mov  q rax,J
488DBC87D8DCFFFF            lea    rdi,0FFFFDCD8h[rdi+rax*4]
D91F                        fst32p [rdi]
48FF0528020000              inc  q K
E929FFFFFF                  jmp    @22
                        @23:
48FF0520020000              inc  q J
E9BAFEFFFF                  jmp    @20
                        @21:
48FF0518020000              inc  q I
E978FEFFFF                  jmp    @18
                        @19:
C3                          ret

✅ 2019/10/15 10:51, Comdiv #29

✅ 2019/10/15 12:30, kt #30


.L17:
xor      r8d, r8d
.L16:
Pxor     xmm1, xmm1
lea      rax, [rbx+r8]
lea      rcx, [r10+r8]
mov      rdx, rdi
.L15:
movss    xmm0, DWORD PTR [rdx]
add      rax, 4000
add      rdx, 4
shufps   xmm0, xmm0, 0
movups   xmm6, XMMWORD PTR [rax-4000]
cmp      rcx, rax
mulps    xmm0, xmm6
addps    xmm1, xmm0
jne .    L15
movups   XMMWORD PTR [r9+r8], xmm1
add      r8, 16
cmp      r8, 4000
jne      .L16
add      rdi, 6000
add      r9, 4000
cmp      r11, rdi
jne      .L17

✅ 2019/10/15 13:05, Александр Коновалов aka Маздайщик #31

allocate

?index

?ret

allocate

?ret

allocate

?index

dcl  n      fixed(31),
     x(*)   float ctl;
get list(n);
allocate x(0:n);

allocate arr(a:b, c:d…)

?index

?ret

✅ 2019/10/15 13:20, Александр Коновалов aka Маздайщик #32

allocate

?index

?ret

УМНОЖЕНИЕ_МАТРИЦ:PROC(P1,P2,P3,M,N,Q);

//---- ВХОД A(M,N) И B(N,Q), ОТВЕТ — МАТРИЦА C(M,Q) ----

DCL (P1,P2,P3)   PTR;       // УКАЗАТЕЛИ НА МАТРИЦЫ
DCL (M,N,Q)      FIXED(31); // ЗАДАННЫЕ ГРАНИЦЫ
DCL (A,B,C)(*,*) FLOAT CTL; // ДИНАМИЧЕСКИЕ МАТРИЦЫ
DCL (I,J,K)      FIXED(31); // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- ВОССТАНАВЛИВАЕМ ДИНАМИЧЕСКИЕ МАССИВЫ ----

ALLOCATE A(M,N)=P1;
ALLOCATE B(N,Q)=P2;
ALLOCATE C(M,Q)=P3;

//---- УМНОЖЕНИЕ МАТРИЦ ----

DO I=1 TO M;
   DO J=1 TO Q;
          C(I,J)=0;
          DO K=1 TO N;
                 C(I,J)+=A(I,K)*B(K,J);
          END K;
   END J;
END I;
END УМНОЖЕНИЕ_МАТРИЦ;

allocate arr(a:b, …)=p;

char buffer[sizeof(std::string)];
std::string *p = new (buffer) std::string;

buffer

std::string

✅ 2019/10/15 13:31, kt #33

✅ 2019/10/15 15:06, Comdiv #34

Так по предлагаемой технологии достаточно на лету менять операнды-константы 4000 и 6000 и этот же код будет действовать для динамических границ с той же 4-х кратной скоростью.

✅ 2019/10/15 15:07, Александр Коновалов aka Маздайщик #35

?INDEX(1,2)=M; ?INDEX(2,2)=N;
?RET(ADDR(A));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ A
?INDEX(1,2)=N; ?INDEX(2,2)=Q;
?RET(ADDR(B));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ B
?INDEX(1,2)=M;
?RET(ADDR(C));                    // ИЗМЕНЯЕМ КОМАНДЫ ДЛЯ C

✅ 2019/10/15 15:22, Александр Коновалов aka Маздайщик #36

УМНОЖЕНИЕ_МАТРИЦ:PROC(A,B,C);

//---- ВХОД A(M,N) И B(N,Q), ОТВЕТ — МАТРИЦА C(M,Q) ----

DCL (A,B,C)(*,*) FLOAT CTL; // ДИНАМИЧЕСКИЕ МАТРИЦЫ
DCL (I,J,K)      FIXED(31); // РАБОЧИЕ ПЕРЕМЕННЫЕ

//---- УМНОЖЕНИЕ МАТРИЦ ----

DO I=1 TO HBOUND(A,1);
   DO J=1 TO HBOUND(B,2);
          C(I,J)=0;
          DO K=1 TO HBOUND(A,2);
                 C(I,J)+=A(I,K)*B(K,J);
          END K;
   END J;
END I;
END УМНОЖЕНИЕ_МАТРИЦ;

✅ 2019/10/15 15:38, Александр Коновалов aka Маздайщик #37

✅ 2019/10/15 16:32, kt #38

Нужно повышать уровень языка.

Да я не спорю. Сначала думалось передавать границы как параметры в ?RET, но поскольку размерностей (число пар) может быть до 15, а переменное число аргументов в PL/1-KT не реализовано, то пришлось по быстрому ввести глобальные переменные ?INDEX, что не очень красиво. Да и все силы ушли на реализацию, на интерфейс уже не хватило.

А вообще, самый компактный синтаксис — синтаксис которого нет.

для неё можно генерировать подпрограмму-переходник

Program_a:proc %include'f1.pl1';
Program_b:proc %include'f1.pl1';
Program_c:proc %include'f1.pl1';

Program(1)=Program_a;
Program(2)=Program_b;
Program(3)=Program_c;

call program(i)(a,b,c,); // параллельный вызов для потока i

Добавить свой отзыв

Написать автору можно на электронную почту
mail(аt)compiler.su

Содержание

Каким должен быть язык программирования?

Анализ и критика

Описание языка

Компилятор

Отечественные разработки

Cтатьи на компьютерные темы

● О превращении кибернетики в шаманство

● Про лебедей, раков и щук

● О замысле и воплощении

● О русском ассемблере

● Арифметика синтаксиса-3

● Концепция владения в Rust на примерах

●● Концепция владения в Rust на примерах, часть 2

●● Концепция владения в Rust на примерах, часть 3

● Суть побочных эффектов в чисто функциональных языках

● О неулучшаемой архитектуре процессоров

● Двадцать тысяч строк кода, которые потрясут мир?

● Почему владение/заимствование в Rust такое сложное?

● Масштабируемые архитектуры программ

● О создании языков

●● Джоэл Спольски о функциональном программировании

● Почему Хаскелл так мало используется в отрасли?

● Программирование исчезнет. Будет дрессировка нейронных сетей

● О глупости «программирования на естественном языке»

● Десятка худших фич C#

● Бесплатный софт в мышеловке

● Исповедь правового нигилиста

● ЕС ЭВМ — это измена, трусость и обман?

● Русской операционной системой должна стать ReactOS

● Почему обречён язык Форт

● Программирование без программистов — это медицина без врачей

● Электроника без электронщиков

● Программисты-профессионалы и программирующие инженеры

● Статьи Дмитрия Караваева

●● Идеальный транслятор

●● В защиту PL/1

●● К вопросу о совершенствовании языка программирования

●● Опыт самостоятельного развития средства программирования в РКК «Энергия»

●● О реализации метода оптимизации при компиляции

●● О реализации метода распределения регистров при компиляции

●● О распределении памяти при выполнении теста Кнута

●● Опыты со стеком или «чемпионат по выполнению теста Кнута»

●● О размещении переменных в стеке

●● Сколько проходов должно быть у транслятора?

●● Чтение лексем

●● Экстракоды при синтезе программ

●● Об исключенных командах или за что «списали» инструкцию INTO?

●● Типы в инженерных задачах

●● Непрерывное компилирование

●● Об одной реализации специализированных операторов ввода-вывода

●● Особенности реализации структурной обработки исключений в Win64

●● О русском языке в программировании

●● Формула расчета точности для умножения

●● Права доступа к переменным

●● Заметки о выходе из функции без значения и зеркальности get и put

●● Модификация исполняемого кода как способ реализации массивов с изменяемыми границами

●● Ошибка при отсутствии выполняемых действий

●● О PL/1 и почему в нём не зарезервированы ключевые слова

●● Не поминайте всуе PL/1

●● Скорость в попугаях

●● Крах операции «Инкогнито»

●● Предопределённый результат

●● Поддержка профилирования кода программы на низком уровне

●● К вопросу о парадигмах

● Следующие 7000 языков программирования

●● Что нового с 1966 года?

●● Наблюдаемая эволюция языка программирования

●● Ряд важных языков в 2017 году

●● Слоны в комнате

●● Следующие 7000 языков программирования: заключение

Компьютерный юмор

Новости и прочее

Последние отзывы

2024/11/21 11:02 ••• Автор сайта
Продолжение цикла и выход из него

2024/11/12 20:24 ••• Вежливый Лис
Правила языка: строки, комментарии

2024/11/12 13:10 ••• Вежливый Лис
Новости и прочее

2024/11/12 00:32 ••• Автор сайта
Оценка надёжности функции с несколькими реализациями

2024/11/06 02:50 ••• Иван
Энтузиасты-разработчики компиляторов и их проекты

2024/11/05 23:51 ••• Борис К.
Изменение приоритетов операций

2024/11/05 23:38 ••• Борис К.
Шестнадцатиричные и двоичные константы

2024/11/04 12:50 ••• Неслучайный читатель
Русский язык и программирование

2024/11/01 12:11 ••• ИванАс
Русской операционной системой должна стать ReactOS

2024/10/27 14:01 ••• Автор сайта
О русском ассемблере

2024/09/29 23:40 ••• Автор сайта
Десятка худших фич C#

2024/09/29 13:10 ••• Автор сайта
ЕС ЭВМ — это измена, трусость и обман?

2024/09/22 21:08 ••• Вежливый Лис
Бесплатный софт в мышеловке