From 2c082d04f6d5eb0c8c0d9e8b59d287e88afa9798 Mon Sep 17 00:00:00 2001
From: Harshal <harshal@bu.edu>
Date: Sat, 15 Nov 2025 19:29:27 -0500
Subject: [PATCH 1/3] Add support for output dicts

---
 CMakeLists.txt                           |   1 -
 model_repository/dict_model/1/model.pt   | Bin 0 -> 14949 bytes
 model_repository/dict_model/config.pbtxt |  24 +++++++++++++++++
 src/model_instance_state.cc              |  26 ++++++++++++++++--
 src/model_instance_state.hh              |   4 +++
 test_client.py                           |  25 +++++++++++++++++
 test_model.py                            |  33 +++++++++++++++++++++++
 7 files changed, 110 insertions(+), 3 deletions(-)
 create mode 100644 model_repository/dict_model/1/model.pt
 create mode 100644 model_repository/dict_model/config.pbtxt
 create mode 100644 test_client.py
 create mode 100644 test_model.py
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5b0e399..fac70e7 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -166,7 +166,6 @@ set(PT_LIBS
 if (${TRITON_PYTORCH_NVSHMEM})
   set(PT_LIBS
       ${PT_LIBS}
-      "libtorch_nvshmem.so"
   )
 endif() # TRITON_PYTORCH_NVSHMEM
 
diff --git a/model_repository/dict_model/1/model.pt b/model_repository/dict_model/1/model.pt
new file mode 100644
index 0000000000000000000000000000000000000000..e01de04248728871644e12fba5b390820acdd50c
GIT binary patch
literal 14949
zcmdVB2{@JA_cwmb9CJd0q`6dPA@|x!r9p!<nKFbBnNuod$W$s(2#HjPsA%BaYd0V%
z6-gzEo>Us7L38On>gjpZGko9g@AqE+>-z8O+Rky#z1CiP?fqG6?azH53v(f14o6&^
z^Oq*YQR1xhadGw1ba4uF($q3D?ZdJ8OUvJ_Ldsu@(L+oo?P@oq<E#df&HJ9h?33cS
z?u8kX|7aUYAL~qhJ6~0%6V%MyH`_}eZ_wd|E|DP)hRX<V=QH+G^F@?Aw}BS5B!NZy
zBJ%R?CU_jYi?)&_bdj70(XEN65h00mqUUNV60ruxZ;q!AFKW}HTqlyKZcLvH2qlkQ
zr;_RN(KOlEoCMupLgKg@r0a?+Nly-^F;#JF>a7|m=bDqtuIe}=#D%<$u7#mr<I(Z?
zCwRUt2u8YC;pyN6Iv}1R-E2)hPxYhn!jd$n+=u<`kRv_on1`QEhSH4^6X-B42{NF_
zn@ZnZ#~L^tLY1|GaIJVFYR6~L6eD43<8Dg0X8mZ;{$#o^+MPJ4+(3>+3Qda<!f_F9
zFg-I49whE(54f*jkB=Hcn&ug?(jvp?(5w_{Vwb>tx*AEYIK<N8{=f0M_9@c&BKD}0
zBS0sYrIVzY<H^*la58uBbm}O+2dAcI5S3R`iEQ7QG-4WIT=qxObMxoWZ5FrTvFK8K
zq`sAr?i64J&T(m@l^6As7)B3)2HjGS&vd0b(8cD1$hHH*r1GFG*>T#OI(nvJL{2Kz
zNDL+o?iWCEejF`-X-5-l!pMReC30s_GCB2GoSw7Lh8^9N#-~ftsex4%y^)Ygiv_~4
zV2vs@9nb-{^5Q@zB#tOON+oj)yh#doG0iRTqmtI~^pSKN*g8+9OHG`qg@ixZ7RJMO
z*`C-vHv-0xximLtD_rc}L~z_kDD-r|nzc=k^CX5$?RNy7Z-x^UaSv)WZY|l+v4pg$
z3X!P==Ef%*Cea&gBNIR33;L;qkepX8WJ}{-`q5w+CSKB~q0={#YWqQ~&&p^pPQJ-|
zx$PKiJ(EaHEwsq|<vYj(HB-X0Os5A&?ZBv}u_Vnj3x_^PAetqUNN}7m5mnmDTbgzf
z=T>YcRxP8*Bx^O?RI!*A>My3V5+Z2JniL`#w2IWJ6~Jz~l8o|*qK3gKbV{iOJ)UPw
zX~$;h=lOzts1Qz`HFIgcqcCW`*g#rSr0A`P1S%F54hzl<r(vnGWJ_rnX?Bz&-tKJ}
z?cu|W==%&}g0_>&5=#;k8bhzNZz8u9MbXEun-!ed4b>LmRMKz}jSdwhOO>;zt=)CJ
zzI!S4|B{E1`gWvM!;91p;gTU=#(|D$7}?ykj;z`+4SY1-!ibl)Sm0I-K7)hEO4o&O
z|D_>m8I?><xHuw{IGN;4i-pslX3}@p?da9wY?$Kt6aqeH5Ia+OvWFvvSE6EZ_tGWs
zsC)+``e)&QCn@x|CPAwATLZIbNj5G#xPqQj-b7<U9)d$^IIZg+PLy|?#SK?>QI#3t
zILyPDnmDA9^3&;5uF8R4bdV%<M1;J`3MO~H#?ZD3DZ1bE9a?V-XKpSGrQr{Tf?4wp
z%JEMn%k(ly3~wD-XQvMZ;i5EdOglWZ7|1R;IiG5v7s+bfL#DrtXVi2P$y6T;+N`^o
zc>3$o0~Pkv?W`2`E$YPOmbTzGA&mHZiXfi)D|nVg^&ob`h>m~u2>Q+Prqu_va6^qD
z(LAd{KIarc@V*;txL`89C^L<wULHm&idLaz&T9H7Re&Vb$WfRd&h(u*6GB@CQ$?*5
z;x;M~r<b1ttD2=GE6o8HX{z&V*Q}&zax)-I`8ett&%>{DBW;&VfY}`^v&m%|sUco?
zuyZEyPKqP?UW3Vs*E{IDW<ruX6hWDD23xDYVwRIW)sWah`Y0}?{k${D`I<pg+As@`
zS;}MeM24~Fu4J0L#?uT3W%Ar479L*R0BJX_LPKF7k&8J7uCHg3yz~7@@G&h?G%u6B
zeOrJ^w-y<1S(Fc>Hi!|Oi$z#AQ4xjMC-6oflMb?|W`l)i(>V!YB*rd_sHl~L(lRbt
z7!m`+Dq_eby&cr7G?boR=!a(wchV`R^{Mvqbhuu*9U7W;k`;Wc>$cp2ZKt-9%O<0t
zV{$D<Pdx@+`di3vV;MSp!EGok9Z$|k1`#2%FmlX8na-`$BYID)N%FN&x<fUNzMJbo
zYYelf+s-6<lf;q+m7!#JnjASCG9FgeG@$wRjU?1aAI$uR62Ac>$Y`dEdHPhIetc{|
zwis_A9nYrF`e!HD?V0Ih-@<8-By<9O%u;B?hs6-3u!l}EOrZBR`qNDwmwD%>E&-#4
z82Td5gkGLL92Dc!=)n@8r!`JtzPAzC)SXPs+@_Ir>vzz#!3n^tNG4+HyD3VHCT9h+
zX#VMVdQ&hPW^T*J$4ARSJ2sg-36h}CbOM+)i+9p0;V5$MdOR5{IGDOe&8Ipa<H(iD
z-(dB&tt3n@2@V9L5FW2TExjlJ3r%9MVeejgN4XD?Klqu~C)$`APIwF}b_}Ou6M>jM
zjUeeW`cRL<PkE2ljv)({`q4cn^4JY+lW|LJ7Tp`F26x<SsgPqVE&p;K3L6HHGsTBk
zlj~DKDmZ{V-HuRrJBZ%g6h|z~#l-XdN;7K3IGmnt@h|nkgx>XmwwbBU-_!?xDHwkF
zpiNVk406qa;MOG6o;rs<dG!%;o_}H=PEg~=xipYjbOO1{ClZ&ak9c;(TKaHkG9720
zMxWntVisSSO5(SaVuJV@I$**=>b=~PTvBqND?i+Vb%L9y5vP;&9CsRa1gWC$n~ktc
zd^FD7l|l>Bcao|H&Sc8=O{DS8JK&vv!_Mde^pv>)Wv(i8oM#@)k%*;ZYtKMzWj*^=
zX9v|!Fd|3$D??3GB7Kx7P4<lrL~iX<wx85?YBM?(di-`R@kPu9ejU}*|IKftx8HQk
zOeg*i{Px3*k1Z;UH|RFuHTzd=9Qlf)pMHXhh;%To+l^ChD8tRR%gpP_o!I<EmSn`s
zLZ(?gx-2SVM=D%I_g5xN@ih?=V73C5n@Sk(9`DCg+m3@A|2Mdv6l3nCeGqgxlX;_b
z2)93#CG3pln0fmZT<f%8@kj#J=`3ROKOM%nIaSaRx~Hsv*FtuMgeN{2^AY7gNfDc1
z6D)~+2U7O$fm#*7h1t{L^q!Z-$FCP6xo-^e>1|L`8_o1zF#>fSXThbm*|1`;Gz|=%
z!U%bA>AW|d#wYjh!fcNae0-z<c{e2Kp{LbQx6y}P5cL6TOzPN>*DpcY<1w09KL>%2
zh||aSfw@(Fxazn9lv`YZ=nHXhuYVIP-f;`}2)=;Pb$W1h!ccT-kR=ukd+=hRCsawV
z#j6GqG$L#{M1_sOrDv)zL$45bPS!)If^1x>FbH*w8gc*56i7HIOJ;4J51sG2VUn0W
z+%l-Z>Xr>S>5xA}3Qb}(>bCIG^xW`D=^Gg4pN~3c^3k#I1ZFJvW&AHSK#0FJT(#W-
z4bxwu^t!voUq+WeZv1VgJohQH&+imJpCT*U_Z`lZO=J?RBjN3fqZs;|4y$N+5mMdM
zm?yr+0Ijt_eEfd=aMhFX*{Oy?GM8`~_XC@~WHS3!;T>EZd>dERMq%-jHK?IA1sn?v
zu(NnP=GBPN^7mVr{M%h{bj@wBN;{4;I}ruCi}`Wz3*K(YGCt&R5szONr?0in;<*EN
z(f!m@$k)w)19|&E{?;rk*185k!<WJS;!RA${ELuQu7nS3L(#DQ4m)sR25YuMnxq`-
z;tko@22OLuNo>ar<04rn%(ztr+w#_9MCud>U-E>RbYvm=S<XemWx!z$hYtHNh?#A2
z7@}4DA%9l{dT`Sj-#|I4+jIch1|h7k^~8Ip2}anIp!W4>#?Cj}$ZOVsQ~N#hVWLkb
z%nF!+at4o#wcc)rDOUx_*^d{nc(fcD-#-Jr*F`}t=OWInmmvAPd+=N9KpZqm4ZA|G
zq3^5dIF{Fr0WE`YR8<R#mYqf^!DiOI?-%@<bpXTOOOsuWFQ9914MaK>Kx$bGO2lU~
z&l~cw;BX!4XWPP+H`|%mnI)L4CQUCs(gKsBBe14%04vyZ3%{srVxEsphQ3m1a7bYy
zWVhYK?b}}A-n4_L87V}U@0$&8lH_1%TrOi>R{+bn12IvJixUl_LE*hVI0-iJ&PSYq
z6K|y0_tX`+HkC|)ts}#Zsbf#6zCph;#kjQV0yGcl&t^|~4;ootnNgRLFfFSV;to#-
z**j9Sea1EPpYDT^IxjG5dMe9SmV<8RYHU(JirWi{CO(Mm4~ee6*ihPyJ2ee?tH-o}
zohFBV2{;1z>$>sex+=ElVg>FB9Dv&z$G}C_g^3P~gf)}>SV@83@Vv}%_@Li{B{OX?
z;gu`nGVu*cJ~aTnl&e@jA_48yGuaaLGZ=Bsfzi-kk4x?ffV`_PdHVSVYuI0uo*b-%
zEr~oNX9`)p@={prE=NRO=OIt_6>r;!co@?B2~MSiGbQU6qO+v{hN~<<j=MBbdZCF!
z=4*pN;tt$Ccr(P^5T(v@L`Yl77u>Qh4L`=cz&Sei@&3(D&{#Bu`C8u1n9h(g7VCcv
z+>YJ>&&a_rG2|*t+r1NBjoQVS>1lwR%_aU`m7)=imH2RwA5WbP#g~s&VQ<k5448Tu
zS6@j3+k76*J{iR}OYVlMS2x*5ZJAi--i{wcY%odhH3(mrz%D*4M>B1N@Wqm`C=eQl
zwT@Ec&9rV<Ql|k8EgE=_D@*s;_k{*;DQd8?1dI0R;FFhckf*K>LN58t)r?bYj%^-v
zn=fKUI^X4m`;KS&%-RdrR0WAvz)2{sj58j_9m?vKi4oUNi*dV)H9Wkwl)aP2V=QM3
zMsE3HX5}COR(j<CY@5;nHzksA^4kDhQDY1J5A<iFT{g2J;Wg-{z6;!)j<X5Y58?3;
z37DX^5YEI`;{H8rVfnILFtIrfZq8oJ`S~wkRfsQBC7=i<mZ#9cyat?<$3v*Q3%=eP
z%UGRzgaY&4q2!^hFyyc#Nu6&F3NMAJL{S8<3t!=!SuM<t_(m9-eFtx^pMf5_lVC;8
zKzQ8EC2L+cKyCg8IP&2GdX2ovm<_s(I{I5+Nt!#p6jg-Jx;o4nDLLa0GuPsDdpXh_
z<iLu996Z}AM^$gdvyH};aM$JwC~D6}lX!V>9Q6U(5+Zo(1Qvlpy!pg&o>Rax<p!)O
zRzUlGHW=|b46c1Fz?e>7yzB<-*HPBMUE;{k4GLJ&coJm#aL9<~q2N{Q$QH=V!$!?a
zusgdLoUe<M#_Wwy?EH$^bhR7%>mNrU<pn@nb+K_uHjX;H8|S<kjfQ9Mu^q?d=-QHI
zoFcr6^~oEGA$RMIg}&B<+1vf#p_+%qns<y<4ivDnSGhx&;}+&^@CGJTY%7Ya5v7ye
zq>1+6N?dJtof#ez&G>a&U}tj#ZuVUTeHHfLD}?}b(|ZguTZHJAJ_gJysa#{aC<f*<
zyg_&A;czlH8D!k}dB;(h6x}t#12-oyGrA<m$jvh_&RrVSPYuIO8{62-*lrA8)Cxvt
zRPe>Z?O@}Wj8;wOS?`Dp@EiUT9hORx(bsG7w9o_4NaGipI+T4Laf96wFG*%KN|OmC
z5_no=Z`tKLf^2@ZD1EzUB`zr1jpE+vs3^`MS{0YrYBmOP`?!GTkyp@_R9v<qP?H%o
z=pMec>BLAQA+knwD_m%~iG!aM;TBF6PU8KBJS$71nUg=T>IDV(azQrie;`dNFNead
zTjy|isT4W0{Sa7e>;yI{2Asa+0CDVtrt(i<!RL<B>?xNZ^@JeZ&(R0%=hXP!)r+vj
zF&aPF8$)oAFiwzsgVndvLC*Xbj9NXNRcda6UAu)yIW{8u{0l2IEDZI!Wr(slzkYe)
z4uY4T;gXq&Jd2^XvCZ%_+PAjgO7{!swpY^lSsM$-7!HZOzaM0RB(O+;;Qg#wU=M9j
zMV;7-eK+C5q6hfmOC_pE9At`0XP~CMIfSmHm=u}}4mpje<eJMk9TKD3rU&q4W-hBW
zV+k&rUx{|d)`G9&dQg#hf+AlhVWRR*Bu!DMjefZ4(|+jVEJ9w4*aG&s>!Im=8M+A`
zhWh;N$g2@2ZZ#Js&Tn1CXbQ{H>J(AZRmFkYtSro3EkHM&^D`XR?ucGvb6JD;@3605
zH0sxIXmxoD<W`!(vuW|b@e_k4?Gj9d5WIQf98@hXWV$-IAZO>nmX@5sWo_boIzzUs
zHR=+6X)I<9XUJifT|4aQe-Ko44uQkbAQYD$4~J*P<K2b+kY&>~G1IUeeHyhG%^OOv
zao!7-qo2e!Uwi<46c&JA`fI%RNeI{F?tqQg1&CegF7|<01>Un2C0cNhF;kul_u5{g
zslqFW+i3;1>IH1s0t+~BbJ4_2HlkGT0Y4_yf59h$0yNY5BdDY_V0gVJI#*@kXrz#<
z*cbc)A}4ZBrD38;8XBy3M9WGMdTeYOGCDzUzcC4tb7YClg*a5-KZUt4^d@^E?KAf2
z%42uiKf>pWglJ-ADK1(Zi}%HZNQ?LvsJtqHEe$MGrfoqeJH*^jyJFlwdj*<4{|pt(
zb5vie2wm^Cp-N^41b51k!(%$}aeW80biTnHK5iFm7e|?NRe0Oy6f#|NaAmU-x+}iK
z3y-<v!0l3u{j7!ux@AFKIR~y~?8WUf-ol!g2pGG*4Ce)CLEMvJ6E*dxz?K(pVN%5s
z6#LL(?5HbFE_aPXozVhhrke_*SMUb(qvkQQ4qqr8vvxhJ;upqdPLM{8vRA0Iz75}`
zw&Q#iEmWKE8b->?5mDg}xZ#d8eZO`zZ)Rf>&bGP@DIwyxv2Giv<aeS2pRY&^(7><r
zkFw3HbD;8N0dBuy!e}Obf~44N^i+I@x`tfJt>cidfryu$rlNPm0p{aYE?vgw{HjBI
zpd+~oQ-+;o?u_UJ^RQd&)^Itxu%n%)5-3D9=~0|}_A{i^3DYMPJK@;A2wb=FE3OEa
zB3ByyA?Q}WvK=}1*%a}+5P0D=w#0CVL-&20x%npCIk^?j1gFD|8|NXaP>?i?kT6bO
zxq(d&+m7vzk*Tsh1Of7bV75Y)7rbZ-DBDCM+xi?g-Vz{TifeeQCL^rw7lt2HW7)7U
zDQfxN0rnq{1!MPxyv^nkFynSQ3P2;iTDAjEIP#362Jv~xU>3LPb>pV3qV(*;G>kbs
z1^cahh%4`=F$tDNxOn+6Sgj~PR}{^InL_o<r9lT_*zqn_YiBwW(R>yfOpI~%giu`Y
zz82ritpqk-52LqUh4Up=#;)$RU=Vp1Rxe(Sup<(;wzr{<c?0Y{Dn?&tsKJ<yE(lSM
zV%3lOqTJ+9kkBYVAKZ*$6C@&xzi8$$2VJ&8ghCE0J*5DuZSrwe*J4yPu7_I@;>7%*
zAhzDw$*lc&0*8`7_JY$jqsYE#_)u{HYCIK(m>f}h(5)W05em>qWXT?hBe-nf3*NKx
ztJr=b3ib(iK<3?8m|y;dr*ppm96!tOY(Gd4oAX&vw@#nUYT5<WlRx77&#{csZaZeC
zN+|2y|0bNOY=xsI%9&lA>CD6H^`IXDaC+4%d@B~o*vPMB3s;O`9Vae^j~eG;>DQ0E
z=E}D?DK{FMIKyGt#LJMb*#fm!yo`C5W$ConniExbhhn;C8Msc8qQ~>A*~=lNIBB5_
zIVZ0S)BT2F!pSoB_CsUPG)TaW8&9Ls`_fbHokw8k<cG$|_c_GGNQ|0!E@$QTacHRJ
z3uvCW7ayz5#+E_n`Fl;4%#r2LY)x?()UlJjJz9ngRT+x&GwXOdI@@8Ha|%9|JHd!+
zNfTK)amqS0V4&hz$mqkb368X);DbHjxb5>dUZ9zy&t%GSI6eK}c!80<c>!HB)1m(t
zyny_1e$ICiC*t|TVC|qr6i5>wT7z?NL&0pY$hgAV^Lbw3{Ta}qH3LpP6#+*_Rd!Zg
zJM6tD$Qan?!G1;?HeC~=R+rxa9TSZ`JjPpxid_~x9L9g(F@EBI^!{i3&yvh8czk&^
z>f64DNl%L*BRm)HURcB|FzLfec#L9$Th;MUOd3qrR)oep4LFd^&r>lEAm1bpwmKp1
zR4>QJHi5i`4R6tBVkjQ6-UIVmKf@^hp|IcJ8Mp~dgn$#ZFege3?p7M$ljw3hygZi~
zF!(4)y*mV!5n_ZHwH2PeO=X+g?m*1yw{YM80Dj!@7H(XO#oscu(5|TrV%GfzH?Q3W
z!*&VO*m(>GoD-*=_v?^ne-Jz(@8HxfDWcEK#@bsUyn;x@i3`nTsjt*UlwR$EhnESH
z#r#@eg!KjHT)r?(zamQ1mJ~wZob?zrPY5=z2*iZR3|Q0(;_5CNEMekNo42QIYFaGb
zyL=wDKNca1T{(~vxeI&;Jcn^ovP4h680?PU0n622VRPJJ$Qn?Op7*$9TCxZYPvj7%
zt`!iF7z}T|zQf`+cizPFSCH_}6wQT_#9(wPta)|_YL6A;m<>WCOt}N+9Q}$%EFLls
zR``R1x(4i?6NFnWc_0vJhYpTQ7^8cF)Ya%1obr{TS2Q1iT1=I3xmy^>oL0nvyYFM9
zSPmYl$OfVm0DDV>X-nHHC}}*7>mP~H#nJ8fcAF$ETJr#{L%H-w(@Ul`(*;g(Z87zc
zADFGW1*R>#*+a=MjcwxR!|kA##tvgfLP7)!H)_Y@RXrYbxJ5wh`3h#KlnDJG%B4dh
z*I{^wJ+yO2Kmxgh%f{#8`J>HfF<=|Y7(QZ8=G?&<4>HiCq7-Iih(dA7VYqgWLoQ8{
zp#pYS;n{uuJ(Ab`;F=48l5}Zm*_6o?>>OMs{Dn(FFBB~|L}IL(HB5OZM%6#;fuYqi
zuwKgybI;l0+0?zfXX&ZXmtO-IhjHjZKIXdTIkS7RMc}nWA}SoLVLT^kfY$g}43*A9
zugMS4BiM;eI9~=z+&0jiwH!E;3&DCwGH;`pzOm$?w>WFc6|}A3Lal`u<;b@}P7aGf
ztHlU;oCME4a``z~9W92BgJ8YS_%Vk==UN@ZBsQCwA%7h0zkY^`Z3!?}a4zVG-iJq~
z$!yF8WRfD5@I+t6;|b<7@A&9EW=6^#s5Yr$Jf6hBnBfsnb4G&Pv(MtaIUbHigDFFc
zrRf`qqo@@<l2<XV4?b#7#zl9-@a~j*xIV7Xc*JZ?a2Ji_4H?&r62-uD-flsih8pzA
zaDl6*<xo;aj&460hWqqfu<X+g<HR&a@a}4aN`?4uamDi59Fuk-4yUL8TO3sF9S8Nz
zOb7f+9Msj7APr-*v2XHG_%OW?A79w}E#?mQarxAjAHRC~KaVBD(dspphOeiWnd!KH
z8SMw_`sZt?ptFNRppU<^yMqIFs)uvnyj6j|s{-fr+&Jg@amIv&jJE2zxgO~6<l*h%
z?dB&CYo)~h-@zlmVfiXAFNbAL&Yr8C{9PQ}eSAFq1m{}uox@q~tnDZCr(%t7188`A
zYw&N#ukvyY(D3r`c6IXS&i?-5C;V+3QNHAAR}VM$KtB=Z?;;MX0zJF}xDNiV%T{@K
zxi|#6dI$LUI|S)){X|EPw&D}~oB;lnPHwJ#V&6r$W?nu{feXHW$n_Jq65wB><tOpY
zE@$6We%v`-0)g}WB+WUa&2`MVfuqg2<^q8+&dxqwUaro89zNay+<E>kuKunrJ^tYO
zNsX}#wDgm<;y-7=S?1vs;3wnGAKP8b{kv{$KUsIKxei~Y+&7hcg?x4H-=*Z;1!CO=
z=dN1j*XMV~==dr8XUAwb{8*HgPTp=_t`1s%xT<fDtK3C?GC{{r(VaV|U5IakQjZON
z`R4RY?oT_E-G4S(*RLPn=)Qb`{@(<CGJ3!tMi2bmXk9;*|AEoke;7UJZ;aOSQ{|iR
zk#EA_9uq|VVzb&WHtYKh;R}fH1%`eT_{rvBf7m>n@9Ys8J$1nI4o%Hlf*ejy@4--C
z{&OOKeNaT1GwgQ^IrBHY<`2g^X!r)3nGXI>VA`{Tx1wCDZ`3=c@@%4X;gLO;<L3^t
zJr<~YPpv6o*idsb<pHBZ-px7`Q9t{@7LC31b--}x1RF`sWxmrpl{)WsU2st~)3mO8
z&XH4I(O#pXt0XT|yQfbFJUSh(yKr>YNcXIpHfA%e+U#dNd+hrmb9qJajbz^qcIma7
zFKTQ)nk2jGOw8Q0dvP<a&E7dQU`0irF@3Y6*n?vf^){-XNz+-NKQpQ!q@vqF{*98h
zj*MN}n&Ztn)t&cMGfJc;o;e=5`e4BX5e9OWbQb77;Lcl_u*_L3CV2R`CD*-jt><Ib
z#32QO)#Zh1CkqQl^fhs->#o_Kv8mX4;PK`4N4WM9{nOS>*mh50iR;(Q^#{h4ryHnG
zeNF{>TrZk<b*Ta$dE{SRKZNrmRQ|>F8ZLaqyE%M|X#W;JamO6<@=0=021nlvd$QC=
z^?p|4iEtbFtnh|oW?4!#(~|V8Yi?hz8d*Qd=kBY4pA%JKGcWI2#F~;LT2h_t)k`%r
z^{%R^yRV7=C+ClbDlN6qFWuLyo>TSZQq$O2uX)uo2B_wSXX`CDeD!+hE0LgMM&`5Z
zj<KyCmX3}hC2Ei2M;^8u8$Qo>LiFf4+tTNXDXUnGeI1eawdQ(Ys+jzSd!b|6Hk|2u
z`FY^Hxw2Pfo@AW&FjS~XIG9|d_VH9sqB1=28#%7@VP*cU(mT()pLtbB8NA=s|5!q-
z-WF@Y0f+ks?u#EM@pOI2n2~z<O$+wFuDqu)uCc5AtESq`$=<hwMUFoleL1VY?7=5b
zN9t;rUR01{Ip*HC=S_%^pDet{KVRcXX{XtK#bt7d1v^A1uRZv9!vu8?`8L{LQCt08
zc}!B$(%17Yy**i3&>RxrAyB%&$f0NLxZ`(-&*QIM$G@(fCO<WOf4u7FwbT3-xHY}K
zHGhxwn%`snH#o`t1x|CePu_M;OKRG?^m9)R?V4ybX~aWe-DTx6S)*4D8X&){ZGZUv
zL_?9Io4<T{)nO8>Fzj<_XjIe2)Fs>R91*Jh=zXhMYsmD&PO>=<!=4}8e=vG^;K+yX
z#x<X^`4qN!p;5oqm?3@K4!mdyS$02MGPz*uRC?=FZpRZ;y&M?QFXN4A;N{olV8lJY
zmuuDRR^k{dS#Q=AbYax+-#qGUs`E`P3?%yOO13+6{^@I<&_|!P$!yqg(my`dt~7et
zp;_a9Q(B(rIZEh!iGOI>vF9Fpznp)!>_&%uj|*)dof>+LpDyhAZv5xSW5f~rZ(Z0M
z7D7GF#GU5z?rZgpyp#0m0+U>v?&?;Ta!@z0-`3@v*yP!h)pxxRwf0^XbM~ln)yhQ@
z!>u0p+#enqZ#8u2v@-v~02=Uom;cR*77l0KsO)=hQ_=@*lfCeGP2d`K-uWiu>AV4f
zM?8h@oLR8Mv7nEr^NM3B-1Z#Fk#4@{XP@6ylj*v<!>0Uj!X4{6`SpVJkz02?`-G}B
zr(EysjJnyCP}+2HllIO&Bh^#6?@WEGbN%-1v48QjYHz3V#hScW=1zq{=jFl`)vCe+
zW#;N+J#1?<mDGGv@*=>(N<2?))2O@`U43X#VvFW<Ed#wd)?L@85A39`<d61OP@j`h
zB2rj8LLu5oM;+vIYNn29-dK9W)vIMhz2eDut10E`v$fuL<UZKFus>k<9O?G0m&5J$
z41RQSbK*puq9U<*y8)x#-91w5SU={=VbOP2>s4uPhe@W1)ff4&BkVn144E0crbEea
zx4*o+#^Ki8Z@O}>1V=Z@3yQaW46tt2ZC+6^O-$cH;dpJI6(%=aOTrh|4G^p}P%XRs
zMp-!OYm?E62j#ELJ{QD4Eh_!W-vDCbdJ2VOv-z80sK~!<h{+s{|7t_<lhyCF+mABg
z8_LxGg0esBy<gwW+0OGW@4?@Ck$csmc0-m*?{}!(XMQqM%{}c{<ORz~)fYOK$mVoR
zef8>v-zf7TXLx?IuWfiAe6m@36sN*iVx@|;;845P+sv(To?dI+&87^g>^!%XcjL50
zlDe4C`lFKe2?-y*uIj6E<<tm|>~|B2v<2RHkKd+uM|HSv;oTO?udh|Nu68NvU(@7v
zBNJT?N_)MDw~w(us5pODZu$aS?LIrl)4pWK*5+mXuO1rkyq<6pTw88UTOUGioxRkw
zLq=qbs78EeUb^zj7r_^ft4lMZj&@rPcK<rJtIEnDC@4~S8}F1}(8q5{DU|Vk-_A$n
zwtq#XIcM<yei3@(bl|@&#~=8;_9uQtqhzw{)Z*7v_qE8|WN^V>VT#nYLB`(sv((P2
zZyY#EU{ggO`7zga1?+jfC!lEOr;*(PoLk2IWll_Q`|KMy>55r-`TY=`+jos_H)KXE
z9oR0KaZ1p6msY<8iIoc{ne5Ruid?W<r_e=o{3WlO1H5-Vo4aLOt8>bgl?837El<zJ
z+1{Arv1Uq93h(gjepALc?b{dYt0|luH(=E5$0DaUe)$rdR}+_dp?=Q#Pj$}@B|Y14
z<X-D=g%xJ@<HofH?@_w(DKaviJ9$k4cizbtQ}%p5?k}u6rGDqMqL7l8&j${cPt(b|
zwrQqqD|e|*P`{Dc*A)CN&fa<MY0=HHn2u<dvWH52Jl(A#B|dIcInE@iXXhjz$rHe%
z*75nT>pv&?Sx$f0(9mjBoU`P`UE?4nuZagXHneuHyIr1q{EJxEsC<)Qa!Cg3mFq^0
zk@aa7tWwYzdhUQCQ=HL#t+ZXscq%8%ZsYhZ>qK+5o@&n&U9nH(x@kvFSxi!`j?LuE
z_vfdqF71vw<CwoEdoelXQ=!Q%?auhLy$8NJ+Dy>C{|oqP{_l2<_BZ&B{kQ${AMl%H
z{r?aAGA0hsS|4=Ghz{>7q<rDs!Yf<Wyl2{Mc8SuF|BT;xyHlqAe}LbfRrv4mYZ~m5
zamo71v10ex<x+#phRMxfUAVam&kb}bjU6IdwQbPJMI+)Jcb(pv$Pqj`b?WB82X>Fv
zKWZNPpfGkLhZD42?91UHM#lY~C)VF<ZFS!+b@GJlYCU)7o1$f5RfT7)Mo68%?xL+&
zJI`(Q+}2II<Hqiud`YM2Xq4>;<HUW#-isg99XPi1$!ea~{iIcv1MKU~A9{~fIBzj4
zCD(miv*g(k+2><V@Xqda_`1P<wC;hCuL2cX*6Z;Ojo>L47#UV?N=<N+3|O-`C$a_4
zna+q*V`fI?JbD?j=W~O<@PZ!vYKD}&xYC1Ptv~SV|0jNnZj^=g!1uS`;k$O@pzrWi
zKFWvh341<#?|)A6<->Q^uGTTdIms`d^Wj@yeBf(C>jb9b-j>_lLLU<w_R5Q28c4Ua
zC+>{C=^d7>tt@}<8aKmw-bRnTCwC803!PMWI;j%AB%0X;S_tXasiaOnTvZmTRM*GG
ztOvd)`S6{zv3OVZ;=89kE3STnuWS!|^GxDSX7z&a-~V7hq1S1|J0Q@>J22ooqw;U(
zk5Iue-_DvVH6@nx5ClE_J72^3>rs=V$T9joLh$(%XIB>o4{tu%643MG1pWU8^?ycz
zf98giIg)=j*7qri{TPkU|9od!R(J$zIQV)vdwRKY{at%V6<3GAU|;?pCpSJ3#HWFJ
z$d=_k{yk)mpMX1O>FEE=(Fp#+(Fpx5M<e_@M<enFM<dGTW#;>d^&ImB{-9`L|Cyo@
z|3=YBxLQf@ZJg~95NJEuJ9w!dH_CFARS$#KL*&>71p1Ft`{T={ev(m^ep25S&#zgv
zT!6nndip;*RGPoI-%mV2uKodhp2*CU!_npTY_Pfvw?+KZ5~rvCvjSPp<lhx63l4Pk
z>EW2nOyS2${JEz8%{woTz(6n89vdRze*Yc@t*8I94Jv;yh8o{~78Bs=@8RU-vDT@F
z_;T=Y`EU6{EnR~NIuo?@we+-fjf@Np^tB8pXib=)t3QGNM&CeJ$G}iWPus|_$HIjR
zSKb)Sx2~sKm<#kc>yKaV^nPYns^^QJ+IP2q{~gb-lD(f={aI3tkHB7%+P_NnzOVJO
zWY0e8C8_hPWbZpnKTG=d|4CB!SIOQS^3RfL1Ada!`&F_xBmA@E8r7d9^?#M@&4bDO
z<kz;JBzr=`ciBIgvff0F@=vm(hyED#X99qqJ%3fwn^73@lalOV|ET286#T2Y-luEL
zpVT>w_<ME#LQ4Fqy!T1X=qKg-M*i2z|9K9*&mxn58m5>JkMDc$XTSc_9RBtY`0K2C
z7qI3(4QHtS|6sU(o@eix?dN&=kNaN^+*7ChI?vvj{^xnVAOHVgxL@b_XZ-4&{}q06
zu(sBp1NSN`zFW?}k{_ggZHhmAu=5WEzZ4BWRQw>dd#ACVvC7f@VZ%=<{sjD=6X~7G
zq<^wwzRnLNzvsVS$M2ni_>T(oY6*Xc{*n2974DrJRC<YWI7+%d#{K)0WnnHV%HK=h
znyL_gnSXCTy!hkQyeBjA+bO=jp2nB!DQP%D6MO#hvp>IEn2UV7N|9fx^<4k`+W!Oa
CGV!JW

literal 0
HcmV?d00001

diff --git a/model_repository/dict_model/config.pbtxt b/model_repository/dict_model/config.pbtxt
new file mode 100644
index 0000000..c39e708
--- /dev/null
+++ b/model_repository/dict_model/config.pbtxt
@@ -0,0 +1,24 @@
+name: "dict_model"
+platform: "pytorch_libtorch"
+max_batch_size: 8
+
+input [
+  {
+    name: "INPUT__0"
+    data_type: TYPE_FP32
+    dims: [ 10 ]
+  }
+]
+
+output [
+  {
+    name: "logits"
+    data_type: TYPE_FP32
+    dims: [ 20 ]
+  },
+  {
+    name: "embeddings"
+    data_type: TYPE_FP32
+    dims: [ 5 ]
+  }
+]
diff --git a/src/model_instance_state.cc b/src/model_instance_state.cc
index d634f3b..de2603c 100644
--- a/src/model_instance_state.cc
+++ b/src/model_instance_state.cc
@@ -51,7 +51,7 @@ namespace triton::backend::pytorch {
 ModelInstanceState::ModelInstanceState(
     ModelState* model_state, TRITONBACKEND_ModelInstance* triton_model_instance)
     : BackendModelInstance(model_state, triton_model_instance),
-      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false),
+      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false), is_dict_output_(false),
       device_cnt_(0)
 {
   if (Kind() == TRITONSERVER_INSTANCEGROUPKIND_GPU) {
@@ -345,6 +345,18 @@ ModelInstanceState::Execute(
             list_output.elementType()->str() + "]");
       }
       output_tensors->push_back(model_outputs_);
+    } else if (model_outputs_.isGenericDict()) {
+      is_dict_output_ = true;
+      auto dict_output = model_outputs_.toGenericDict();
+      output_dict_key_to_index_.clear();
+      
+      int index = 0;
+      for (auto it = dict_output.begin(); it != dict_output.end(); ++it) {
+        std::string key = it->key().toStringRef();
+        output_tensors->push_back(it->value());
+        output_dict_key_to_index_[key] = index;
+        index++;
+      }
     } else {
       throw std::invalid_argument(
           "output must be of type Tensor, List[str] or Tuple containing one of "
@@ -872,7 +884,17 @@ ModelInstanceState::ReadOutputTensors(
   // The serialized string buffer must be valid until output copies are done
   std::vector<std::unique_ptr<std::string>> string_buffer;
   for (auto& output : model_state_->ModelOutputs()) {
-    int op_index = output_index_map_[output.first];
+    // Use dict key mapping if available
+    int op_index;
+    if (is_dict_output_) {
+      auto it = output_dict_key_to_index_.find(output.first);
+      if (it == output_dict_key_to_index_.end()) {
+        continue;  // Skip outputs not in dict
+      }
+      op_index = it->second;
+    } else {
+      op_index = output_index_map_[output.first];
+    }
     auto name = output.first;
     auto output_tensor_pair = output.second;
 
diff --git a/src/model_instance_state.hh b/src/model_instance_state.hh
index b495510..143e4d5 100644
--- a/src/model_instance_state.hh
+++ b/src/model_instance_state.hh
@@ -73,6 +73,10 @@ class ModelInstanceState : public BackendModelInstance {
   // Map from configuration name for an output to the index of
   // that output in the model.
   std::unordered_map<std::string, int> output_index_map_;
+
+  // If the output is a dictionary of tensors.
+  std::unordered_map<std::string, int> output_dict_key_to_index_;
+  bool is_dict_output_;
   std::unordered_map<std::string, TRITONSERVER_DataType> output_dtype_map_;
 
   // If the input to the tensor is a dictionary of tensors.
diff --git a/test_client.py b/test_client.py
new file mode 100644
index 0000000..f11cb15
--- /dev/null
+++ b/test_client.py
@@ -0,0 +1,25 @@
+# test_client.py
+import tritonclient.http as httpclient
+import numpy as np
+
+# Create client
+client = httpclient.InferenceServerClient(url="localhost:8000")
+
+# Prepare input
+input_data = np.random.randn(5, 10).astype(np.float32)
+inputs = [httpclient.InferInput("INPUT__0", input_data.shape, "FP32")]
+inputs[0].set_data_from_numpy(input_data)
+
+# Request outputs by dict key names
+outputs = [
+    httpclient.InferRequestedOutput("logits"),
+    httpclient.InferRequestedOutput("embeddings")
+]
+
+# Infer
+results = client.infer("dict_model", inputs, outputs=outputs)
+
+# Check output names
+print("Output names:", results.get_response())
+print("Logits shape:", results.as_numpy("logits").shape)
+print("Embeddings shape:", results.as_numpy("embeddings").shape)
diff --git a/test_model.py b/test_model.py
new file mode 100644
index 0000000..e2f5b68
--- /dev/null
+++ b/test_model.py
@@ -0,0 +1,33 @@
+# test_model.py
+import torch
+import torch.nn as nn
+
+class DictOutputModel(nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.fc1 = nn.Linear(10, 50)
+        self.fc2 = nn.Linear(50, 20)
+        self.fc3 = nn.Linear(50, 5)
+    
+    def forward(self, x):
+        features = self.fc1(x)
+        logits = self.fc2(features)
+        embeddings = self.fc3(features)
+        
+        # Return dictionary
+        return {
+            "logits": logits,
+            "embeddings": embeddings
+        }
+
+# Create and save model
+model = DictOutputModel()
+model.eval()
+
+# Trace with example input
+example_input = torch.randn(1, 10)
+traced_model = torch.jit.trace(model, example_input, strict=False)
+
+# Save
+torch.jit.save(traced_model, "model.pt")
+print("Model saved!")

From e8cf1e5f37577d43caf9514af56615c9ec09321a Mon Sep 17 00:00:00 2001
From: Harshal <harshal@bu.edu>
Date: Sun, 16 Nov 2025 13:42:18 -0500
Subject: [PATCH 2/3] Add cached output validation

---
 src/model_instance_state.cc | 73 ++++++++++++++++++++++++++++---------
 src/model_instance_state.hh | 13 ++++++-
 2 files changed, 67 insertions(+), 19 deletions(-)

diff --git a/src/model_instance_state.cc b/src/model_instance_state.cc
index de2603c..effffe9 100644
--- a/src/model_instance_state.cc
+++ b/src/model_instance_state.cc
@@ -51,7 +51,8 @@ namespace triton::backend::pytorch {
 ModelInstanceState::ModelInstanceState(
     ModelState* model_state, TRITONBACKEND_ModelInstance* triton_model_instance)
     : BackendModelInstance(model_state, triton_model_instance),
-      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false), is_dict_output_(false),
+      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false)
+      dict_output_validated_(false),
       device_cnt_(0)
 {
   if (Kind() == TRITONSERVER_INSTANCEGROUPKIND_GPU) {
@@ -149,6 +150,47 @@ ModelInstanceState::ModelInstanceState(
   THROW_IF_BACKEND_INSTANCE_ERROR(ValidateOutputs());
 }
 
+TRITONSERVER_Error*
+ModelInstanceState::ValidateAndCacheDictOutput(
+    const c10::Dict<c10::IValue, c10::IValue>& dict_output)
+{
+  if (dict_output_validated_.load(std::memory_order_acquire)) {
+    return nullptr;
+  }
+  std::lock_guard<std::mutex> lock(dict_validation_mutex_);
+  if (dict_output_validated_.load(std::memory_order_acquire)) {
+    return nullptr;
+  }
+  if (dict_output.size() == 0) {
+    return TRITONSERVER_ErrorNew(TRITONSERVER_ERROR_INVALID_ARG, "Empty dict");
+  }
+  std::vector<std::string> temp_keys;
+  std::unordered_map<std::string, size_t> temp_index;
+  size_t idx = 0;
+  for (auto it = dict_output.begin(); it != dict_output.end(); ++it) {
+    std::string key = it->key().toStringRef();
+    if (!it->value().isTensor()) {
+      return TRITONSERVER_ErrorNew(TRITONSERVER_ERROR_INVALID_ARG, "Not tensor");
+    }
+    temp_keys.push_back(key);
+    temp_index[key] = idx++;
+  }
+  std::vector<std::string> missing;
+  for (auto& output : model_state_->ModelOutputs()) {
+    if (temp_index.find(output.first) == temp_index.end()) {
+      missing.push_back(output.first);
+    }
+  }
+  if (!missing.empty()) {
+    return TRITONSERVER_ErrorNew(TRITONSERVER_ERROR_INVALID_ARG, "Missing keys");
+  }
+  output_dict_keys_ = std::move(temp_keys);
+  output_dict_key_to_index_ = std::move(temp_index);
+  dict_output_validated_.store(true, std::memory_order_release);
+  return nullptr;
+}
+
+
 ModelInstanceState::~ModelInstanceState()
 {
   torch_model_.reset();
@@ -346,16 +388,16 @@ ModelInstanceState::Execute(
       }
       output_tensors->push_back(model_outputs_);
     } else if (model_outputs_.isGenericDict()) {
-      is_dict_output_ = true;
       auto dict_output = model_outputs_.toGenericDict();
-      output_dict_key_to_index_.clear();
-      
-      int index = 0;
-      for (auto it = dict_output.begin(); it != dict_output.end(); ++it) {
-        std::string key = it->key().toStringRef();
-        output_tensors->push_back(it->value());
-        output_dict_key_to_index_[key] = index;
-        index++;
+      if (!dict_output_validated_.load(std::memory_order_acquire)) {
+        TRITONSERVER_Error* err = ValidateAndCacheDictOutput(dict_output);
+        if (err != nullptr) {
+          SendErrorForResponses(responses, request_count, err);
+          return;
+        }
+      }
+      for (const auto& key : output_dict_keys_) {
+        output_tensors->push_back(dict_output.at(key));
       }
     } else {
       throw std::invalid_argument(
@@ -885,15 +927,12 @@ ModelInstanceState::ReadOutputTensors(
   std::vector<std::unique_ptr<std::string>> string_buffer;
   for (auto& output : model_state_->ModelOutputs()) {
     // Use dict key mapping if available
-    int op_index;
-    if (is_dict_output_) {
+    int op_index = output_index_map_[output.first];
+    if (dict_output_validated_.load(std::memory_order_acquire)) {
       auto it = output_dict_key_to_index_.find(output.first);
-      if (it == output_dict_key_to_index_.end()) {
-        continue;  // Skip outputs not in dict
+      if (it != output_dict_key_to_index_.end()) {
+        op_index = it->second;
       }
-      op_index = it->second;
-    } else {
-      op_index = output_index_map_[output.first];
     }
     auto name = output.first;
     auto output_tensor_pair = output.second;
diff --git a/src/model_instance_state.hh b/src/model_instance_state.hh
index 143e4d5..092fa46 100644
--- a/src/model_instance_state.hh
+++ b/src/model_instance_state.hh
@@ -26,6 +26,9 @@
 
 #pragma once
 
+#include <atomic>
+#include <mutex>
+
 #include <stdint.h>
 
 #include <cstdint>
@@ -75,8 +78,11 @@ class ModelInstanceState : public BackendModelInstance {
   std::unordered_map<std::string, int> output_index_map_;
 
   // If the output is a dictionary of tensors.
-  std::unordered_map<std::string, int> output_dict_key_to_index_;
-  bool is_dict_output_;
+  std::atomic<bool> dict_output_validated_;
+  std::mutex dict_validation_mutex_;
+  std::vector<std::string> output_dict_keys_;
+  std::unordered_map<std::string, size_t> output_dict_key_to_index_;
+
   std::unordered_map<std::string, TRITONSERVER_DataType> output_dtype_map_;
 
   // If the input to the tensor is a dictionary of tensors.
@@ -96,6 +102,9 @@ class ModelInstanceState : public BackendModelInstance {
   int device_cnt_;
 
  public:
+  TRITONSERVER_Error* ValidateAndCacheDictOutput(
+      const c10::Dict<c10::IValue, c10::IValue>& dict_output);
+
   virtual ~ModelInstanceState();
 
   // Clear CUDA cache

From c527344722878d83c6d91aa9a22ebc1b78221c7e Mon Sep 17 00:00:00 2001
From: Harshal Chaudhari <chdhr-harshal@users.noreply.github.com>
Date: Sun, 16 Nov 2025 17:00:21 -0500
Subject: [PATCH 3/3] Fix formatting

---
 src/model_instance_state.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/src/model_instance_state.cc b/src/model_instance_state.cc
index effffe9..f738980 100644
--- a/src/model_instance_state.cc
+++ b/src/model_instance_state.cc
@@ -51,7 +51,7 @@ namespace triton::backend::pytorch {
 ModelInstanceState::ModelInstanceState(
     ModelState* model_state, TRITONBACKEND_ModelInstance* triton_model_instance)
     : BackendModelInstance(model_state, triton_model_instance),
-      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false)
+      model_state_(model_state), device_(torch::kCPU), is_dict_input_(false),
       dict_output_validated_(false),
       device_cnt_(0)
 {