diff --git a/src/coreclr/jit/codegenarm64test.cpp b/src/coreclr/jit/codegenarm64test.cpp index 2dad168edd770a..d79b9718400195 100644 --- a/src/coreclr/jit/codegenarm64test.cpp +++ b/src/coreclr/jit/codegenarm64test.cpp @@ -5369,6 +5369,291 @@ void CodeGen::genArm64EmitterUnitTestsSve() INS_OPTS_SCALABLE_H); // FRECPX ., /M, . theEmitter->emitIns_R_R_R(INS_sve_fsqrt, EA_SCALABLE, REG_V6, REG_P6, REG_V6, INS_OPTS_SCALABLE_S); // FSQRT ., /M, . + + // IF_SVE_IH_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ld1d, EA_SCALABLE, REG_V5, REG_P3, REG_R4, 0, + INS_OPTS_SCALABLE_D); // LD1D {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IH_3A_A + theEmitter->emitIns_R_R_R_I(INS_sve_ld1d, EA_SCALABLE, REG_V0, REG_P2, REG_R3, 5, + INS_OPTS_SCALABLE_Q); // LD1D {.Q }, /Z, [{, #, MUL VL}] + + // IF_SVE_IH_3A_F + theEmitter->emitIns_R_R_R_I(INS_sve_ld1w, EA_SCALABLE, REG_V0, REG_P2, REG_R3, 3, + INS_OPTS_SCALABLE_S); // LD1W {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1w, EA_SCALABLE, REG_V0, REG_P2, REG_R3, 3, + INS_OPTS_SCALABLE_D); // LD1W {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1w, EA_SCALABLE, REG_V0, REG_P2, REG_R3, 3, + INS_OPTS_SCALABLE_Q); // LD1W {.Q }, /Z, [{, #, MUL VL}] + + // IF_SVE_IJ_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sw, EA_SCALABLE, REG_V0, REG_P5, REG_R3, 4, + INS_OPTS_SCALABLE_D); // LD1SW {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IJ_3A_D + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sb, EA_SCALABLE, REG_V3, REG_P0, REG_R2, 6, + INS_OPTS_SCALABLE_H); // LD1SB {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sb, EA_SCALABLE, REG_V3, REG_P0, REG_R2, 6, + INS_OPTS_SCALABLE_S); // LD1SB {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sb, EA_SCALABLE, REG_V3, REG_P0, REG_R2, 6, + INS_OPTS_SCALABLE_D); // LD1SB {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IJ_3A_E + theEmitter->emitIns_R_R_R_I(INS_sve_ld1b, EA_SCALABLE, REG_V5, REG_P1, REG_R3, 7, + INS_OPTS_SCALABLE_B); // LD1B {.B }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1b, EA_SCALABLE, REG_V5, REG_P1, REG_R3, 7, + INS_OPTS_SCALABLE_H); // LD1B {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1b, EA_SCALABLE, REG_V5, REG_P1, REG_R3, 7, + INS_OPTS_SCALABLE_S); // LD1B {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1b, EA_SCALABLE, REG_V5, REG_P1, REG_R3, 7, + INS_OPTS_SCALABLE_D); // LD1B {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IJ_3A_F + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sh, EA_SCALABLE, REG_V7, REG_P3, REG_R5, 2, + INS_OPTS_SCALABLE_S); // LD1SH {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1sh, EA_SCALABLE, REG_V7, REG_P3, REG_R5, 2, + INS_OPTS_SCALABLE_D); // LD1SH {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IJ_3A_G + theEmitter->emitIns_R_R_R_I(INS_sve_ld1h, EA_SCALABLE, REG_V2, REG_P1, REG_R6, 1, + INS_OPTS_SCALABLE_H); // LD1H {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1h, EA_SCALABLE, REG_V2, REG_P1, REG_R6, 1, + INS_OPTS_SCALABLE_S); // LD1H {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1h, EA_SCALABLE, REG_V2, REG_P1, REG_R6, 1, + INS_OPTS_SCALABLE_D); // LD1H {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IL_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1d, EA_SCALABLE, REG_V0, REG_P0, REG_R0, 0, + INS_OPTS_SCALABLE_D); // LDNF1D {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sw, EA_SCALABLE, REG_V0, REG_P0, REG_R0, 0, + INS_OPTS_SCALABLE_D); // LDNF1SW {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1d, EA_SCALABLE, REG_V0, REG_P1, REG_R2, 5, + INS_OPTS_SCALABLE_D); // LDNF1D {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sw, EA_SCALABLE, REG_V0, REG_P1, REG_R2, 5, + INS_OPTS_SCALABLE_D); // LDNF1SW {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IL_3A_A + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sh, EA_SCALABLE, REG_V0, REG_P1, REG_R5, 5, + INS_OPTS_SCALABLE_S); // LDNF1SH {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1w, EA_SCALABLE, REG_V0, REG_P2, REG_R4, 5, + INS_OPTS_SCALABLE_S); // LDNF1W {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sh, EA_SCALABLE, REG_V0, REG_P1, REG_R5, 5, + INS_OPTS_SCALABLE_D); // LDNF1SH {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1w, EA_SCALABLE, REG_V0, REG_P2, REG_R4, 5, + INS_OPTS_SCALABLE_D); // LDNF1W {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IL_3A_B + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1h, EA_SCALABLE, REG_V1, REG_P3, REG_R2, 5, + INS_OPTS_SCALABLE_H); // LDNF1H {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sb, EA_SCALABLE, REG_V0, REG_P4, REG_R1, 5, + INS_OPTS_SCALABLE_H); // LDNF1SB {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1h, EA_SCALABLE, REG_V1, REG_P3, REG_R2, 5, + INS_OPTS_SCALABLE_S); // LDNF1H {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sb, EA_SCALABLE, REG_V0, REG_P4, REG_R1, 5, + INS_OPTS_SCALABLE_S); // LDNF1SB {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1h, EA_SCALABLE, REG_V1, REG_P3, REG_R2, 5, + INS_OPTS_SCALABLE_D); // LDNF1H {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1sb, EA_SCALABLE, REG_V0, REG_P4, REG_R1, 5, + INS_OPTS_SCALABLE_D); // LDNF1SB {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IL_3A_C + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1b, EA_SCALABLE, REG_V2, REG_P5, REG_R3, -4, + INS_OPTS_SCALABLE_B); // LDNF1B {.B }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1b, EA_SCALABLE, REG_V2, REG_P5, REG_R3, -2, + INS_OPTS_SCALABLE_H); // LDNF1B {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1b, EA_SCALABLE, REG_V2, REG_P5, REG_R3, 2, + INS_OPTS_SCALABLE_S); // LDNF1B {.S }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnf1b, EA_SCALABLE, REG_V2, REG_P5, REG_R3, 1, + INS_OPTS_SCALABLE_D); // LDNF1B {.D }, /Z, [{, #, MUL VL}] + + // IF_SVE_IM_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ldnt1b, EA_SCALABLE, REG_V0, REG_P1, REG_R2, -5, + INS_OPTS_SCALABLE_B); // LDNT1B {.B }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnt1d, EA_SCALABLE, REG_V3, REG_P4, REG_R5, -1, + INS_OPTS_SCALABLE_D); // LDNT1D {.D }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnt1h, EA_SCALABLE, REG_V6, REG_P7, REG_R8, 0, + INS_OPTS_SCALABLE_H); // LDNT1H {.H }, /Z, [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ldnt1w, EA_SCALABLE, REG_V1, REG_P2, REG_R3, -8, + INS_OPTS_SCALABLE_S); // LDNT1W {.S }, /Z, [{, #, MUL VL}] + + // IF_SVE_IO_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rob, EA_SCALABLE, REG_V0, REG_P1, REG_R2, 0, + INS_OPTS_SCALABLE_B); // LD1ROB {.B }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rod, EA_SCALABLE, REG_V4, REG_P5, REG_R6, -32, + INS_OPTS_SCALABLE_D); // LD1ROD {.D }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1roh, EA_SCALABLE, REG_V8, REG_P3, REG_R1, -256, + INS_OPTS_SCALABLE_H); // LD1ROH {.H }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1row, EA_SCALABLE, REG_V3, REG_P4, REG_R0, 224, + INS_OPTS_SCALABLE_S); // LD1ROW {.S }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rqb, EA_SCALABLE, REG_V6, REG_P7, REG_R8, 64, + INS_OPTS_SCALABLE_B); // LD1RQB {.B }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rqd, EA_SCALABLE, REG_V9, REG_P0, REG_R1, -128, + INS_OPTS_SCALABLE_D); // LD1RQD {.D }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rqh, EA_SCALABLE, REG_V4, REG_P5, REG_R6, 112, + INS_OPTS_SCALABLE_H); // LD1RQH {.H }, /Z, [{, #}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld1rqw, EA_SCALABLE, REG_V31, REG_P2, REG_R1, -16, + INS_OPTS_SCALABLE_S); // LD1RQW {.S }, /Z, [{, #}] + + // IF_SVE_IQ_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V0, REG_P1, REG_R2, -16, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V31, REG_P1, REG_R2, -16, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V0, REG_P1, REG_R2, 14, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3q, EA_SCALABLE, REG_V0, REG_P4, REG_R5, -24, + INS_OPTS_SCALABLE_Q); // LD3Q {.Q, .Q, .Q }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3q, EA_SCALABLE, REG_V0, REG_P4, REG_R5, 21, + INS_OPTS_SCALABLE_Q); // LD3Q {.Q, .Q, .Q }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V0, REG_P5, REG_R3, -32, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V0, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V12, REG_P1, REG_R2, -16, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V13, REG_P1, REG_R2, 14, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3q, EA_SCALABLE, REG_V14, REG_P4, REG_R5, -24, + INS_OPTS_SCALABLE_Q); // LD3Q {.Q, .Q, .Q }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3q, EA_SCALABLE, REG_V15, REG_P4, REG_R5, 21, + INS_OPTS_SCALABLE_Q); // LD3Q {.Q, .Q, .Q }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V16, REG_P5, REG_R3, -32, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V27, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V28, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V29, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V30, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4q, EA_SCALABLE, REG_V31, REG_P5, REG_R3, 28, + INS_OPTS_SCALABLE_Q); // LD4Q {.Q, .Q, .Q, .Q }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2q, EA_SCALABLE, REG_V31, REG_P1, REG_R2, -16, + INS_OPTS_SCALABLE_Q); // LD2Q {.Q, .Q }, /Z, [{, #, MUL + // VL}] + + // IF_SVE_IS_3A + theEmitter->emitIns_R_R_R_I(INS_sve_ld2b, EA_SCALABLE, REG_V0, REG_P1, REG_R2, -16, + INS_OPTS_SCALABLE_B); // LD2B {.B, .B }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2d, EA_SCALABLE, REG_V4, REG_P5, REG_R7, 14, + INS_OPTS_SCALABLE_D); // LD2D {.D, .D }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2h, EA_SCALABLE, REG_V6, REG_P5, REG_R4, 8, + INS_OPTS_SCALABLE_H); // LD2H {.H, .H }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld2w, EA_SCALABLE, REG_V0, REG_P0, REG_R1, 2, + INS_OPTS_SCALABLE_S); // LD2W {.S, .S }, /Z, [{, #, MUL + // VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3b, EA_SCALABLE, REG_V0, REG_P0, REG_R0, 21, + INS_OPTS_SCALABLE_B); // LD3B {.B, .B, .B }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3d, EA_SCALABLE, REG_V0, REG_P0, REG_R0, -24, + INS_OPTS_SCALABLE_D); // LD3D {.D, .D, .D }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3h, EA_SCALABLE, REG_V0, REG_P0, REG_R0, 21, + INS_OPTS_SCALABLE_H); // LD3H {.H, .H, .H }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld3w, EA_SCALABLE, REG_V0, REG_P0, REG_R0, -24, + INS_OPTS_SCALABLE_S); // LD3W {.S, .S, .S }, /Z, [{, + // #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4b, EA_SCALABLE, REG_V31, REG_P2, REG_R1, -32, + INS_OPTS_SCALABLE_B); // LD4B {.B, .B, .B, .B }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4d, EA_SCALABLE, REG_V8, REG_P0, REG_R0, 28, + INS_OPTS_SCALABLE_D); // LD4D {.D, .D, .D, .D }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4h, EA_SCALABLE, REG_V5, REG_P4, REG_R3, -32, + INS_OPTS_SCALABLE_H); // LD4H {.H, .H, .H, .H }, /Z, + // [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_ld4w, EA_SCALABLE, REG_V0, REG_P1, REG_R2, 28, + INS_OPTS_SCALABLE_S); // LD4W {.S, .S, .S, .S }, /Z, + // [{, #, MUL VL}] + + // IF_SVE_JE_3A + theEmitter->emitIns_R_R_R_I(INS_sve_st2q, EA_SCALABLE, REG_V0, REG_P3, REG_R0, -16, + INS_OPTS_SCALABLE_Q); // ST2Q {.Q, .Q }, , [{, #, MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_st3q, EA_SCALABLE, REG_V2, REG_P3, REG_R4, 21, + INS_OPTS_SCALABLE_Q); // ST3Q {.Q, .Q, .Q }, , [{, #, + // MUL VL}] + theEmitter->emitIns_R_R_R_I(INS_sve_st4q, EA_SCALABLE, REG_V7, REG_P6, REG_R5, 28, + INS_OPTS_SCALABLE_Q); // ST4Q {.Q, .Q, .Q, .Q }, , [