Reference-LAPACK
diff --git a/‎SRC/CMakeLists.txt‎
Lines changed: 2 additions & 0 deletions b/‎SRC/CMakeLists.txt‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎SRC/Makefile‎
Lines changed: 2 additions & 0 deletions b/‎SRC/Makefile‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎SRC/dorglq.f‎
Lines changed: 1 addition & 23 deletions b/‎SRC/dorglq.f‎
Lines changed: 1 addition & 23 deletions
diff --git a/‎SRC/dorgrq.f‎
Lines changed: 3 additions & 19 deletions b/‎SRC/dorgrq.f‎
Lines changed: 3 additions & 19 deletions
diff --git a/‎SRC/dtrmmoop.f‎
Lines changed: 1 addition & 1 deletion b/‎SRC/dtrmmoop.f‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎SRC/lapack_64.h‎
Lines changed: 10 additions & 3 deletions b/‎SRC/lapack_64.h‎
Lines changed: 10 additions & 3 deletions
diff --git a/‎SRC/slarfb0c2.f‎
Lines changed: 36 additions & 36 deletions b/‎SRC/slarfb0c2.f‎
Lines changed: 36 additions & 36 deletions
@@ -116,6 +116,8 @@ set(SLASRC
    slauu2.f slauum.f sopgtr.f sopmtr.f sorg2l.f sorg2r.f
    sorgbr.f sorghr.f sorgl2.f sorglq.f sorgql.f sorgqr.f sorgr2.f
    sorgrq.f sorgtr.f sorgtsqr.f sorgtsqr_row.f sorm2l.f sorm2r.f sorm22.f
+   sorgkr.f sorgrk.f sorgkl.f sorglk.f
+   slumm.f strtrm.f strmmoop.f
    sormbr.f sormhr.f sorml2.f sormlq.f sormql.f sormqr.f sormr2.f
    sormr3.f sormrq.f sormrz.f sormtr.f spbcon.f spbequ.f spbrfs.f
    spbstf.f spbsv.f  spbsvx.f
 
@@ -145,6 +145,8 @@ SLASRC = \
    slauu2.o slauum.o sopgtr.o sopmtr.o sorg2l.o sorg2r.o \
    sorgbr.o sorghr.o sorgl2.o sorglq.o sorgql.o sorgqr.o sorgr2.o \
    sorgrq.o sorgtr.o sorgtsqr.o sorgtsqr_row.o sorm2l.o sorm2r.o sorm22.o \
+   sorgkr.o sorgrk.o sorgkl.o sorglk.o \
+   slumm.o strtrm.o strmmoop.o \
    sormbr.o sormhr.o sorml2.o sormlq.o sormql.o sormqr.o sormr2.o \
    sormr3.o sormrq.o sormrz.o sormtr.o spbcon.o spbequ.o spbrfs.o \
    spbstf.o spbsv.o  spbsvx.o \
 
@@ -190,30 +190,8 @@ SUBROUTINE DORGLQ( M, N, K, A, LDA, TAU, WORK, LWORK, INFO )
       END IF
 *
       NBMIN = 2
-      NX = 0
+      NX = MAX( 0, ILAENV( 3, 'DORGLQ', ' ', M, N, K, -1 ) )
       IWS = M
-      IF( NB.GT.1 .AND. NB.LT.K ) THEN
-*
-*        Determine when to cross over from blocked to unblocked code.
-*
-         NX = MAX( 0, ILAENV( 3, 'DORGLQ', ' ', M, N, K, -1 ) )
-         IF( NX.LT.K ) THEN
-*
-*           Determine if workspace is large enough for blocked code.
-*
-            LDWORK = M
-            IWS = LDWORK*NB
-            IF( LWORK.LT.IWS ) THEN
-*
-*              Not enough workspace to use optimal NB:  reduce NB and
-*              determine the minimum value of NB.
-*
-               NB = LWORK / LDWORK
-               NBMIN = MAX( 2, ILAENV( 2, 'DORGLQ', ' ', M, N, K,
-     $                      -1 ) )
-            END IF
-         END IF
-      END IF
 *
       IF( NB.GE.NBMIN .AND. NB.LT.K .AND. NX.LT.K ) THEN
 *
 
@@ -207,28 +207,12 @@ SUBROUTINE DORGRQ( M, N, K, A, LDA, TAU, WORK, LWORK, INFO )
 *        Determine when to cross over from blocked to unblocked code.
 *
          NX = MAX( 0, ILAENV( 3, 'DORGRQ', ' ', M, N, K, -1 ) )
-         IF( NX.LT.K ) THEN
-*
-*           Determine if workspace is large enough for blocked code.
-*
-            LDWORK = M
-            IWS = LDWORK*NB
-            IF( LWORK.LT.IWS ) THEN
-*
-*              Not enough workspace to use optimal NB:  reduce NB and
-*              determine the minimum value of NB.
-*
-               NB = LWORK / LDWORK
-               NBMIN = MAX( 2, ILAENV( 2, 'DORGRQ', ' ', M, N, K,
-     $                      -1 ) )
-            END IF
-         END IF
       END IF
 *
       IF( NB.GE.NBMIN .AND. NB.LT.K .AND. NX.LT.K ) THEN
 *
 *        We want to use the blocking method as long as our matrix is big enough
-*        and it's deemed worthwhile with the extra memory allocations
+*        and it's deemed worthwhile
 *
          KK = K
       ELSE
@@ -256,13 +240,13 @@ SUBROUTINE DORGRQ( M, N, K, A, LDA, TAU, WORK, LWORK, INFO )
          CALL DLARFT( 'Transpose', 'Rowwise', N-K+I+IB-1, IB,
      $                A( II, 1 ), LDA, TAU( I ), A( II, N-K+I ), LDA )
 *
-*        Apply H**T to A(1:m-k+i-1,1:n-k+i+ib-1) from the right
+*        Apply H to A(1:m-k+i-1,1:n-k+i+ib-1) from the right
 *
          CALL DLARFB0C2(.TRUE., 'Right', 'No Transpose', 'Backward', 
      $         'Rowwise', II-1, N-K+I+IB-1, IB, A(II,1), LDA,
      $          A( II, N-K+I ), LDA, A, LDA)
 *
-*           Apply H**T to columns 1:n-k+i+ib-1 of current block
+*           Apply H to columns 1:n-k+i+ib-1 of current block
 *
          CALL DORGRK( IB, N-K+I+IB-1, A( II, 1 ), LDA )
 
 
@@ -215,7 +215,7 @@ RECURSIVE SUBROUTINE DTRMMOOP(SIDE, UPLO, TRANSA, TRANSB,
          EXTERNAL          LSAME, DDOT
 *        ..
 *        .. External Subroutines ..
-         EXTERNAL          DGEMM
+         EXTERNAL          DGEMM, DAXPY, DLASET, DSCAL
 *        ..
 *        .. Intrinsic Functions ..
          INTRINSIC         MIN
 
@@ -911,12 +911,12 @@
 #define DORGKL DORGKL_64
 #define DORGKR DORGKR_64
 #define DORGRK DORGRK_64
-#define DLUMM DLUMM_64
-#define DTRTRM DTRTRM_64
-#define DTRMMOOP DTRMMOOP_64
 #define DORGTR DORGTR_64
 #define DORGTSQR DORGTSQR_64
 #define DORGTSQR_ROW DORGTSQR_ROW_64
+#define DLUMM DLUMM_64
+#define DTRTRM DTRTRM_64
+#define DTRMMOOP DTRMMOOP_64
 #define DORHR_COL DORHR_COL_64
 #define DORM22 DORM22_64
 #define DORM2L DORM2L_64
@@ -1509,9 +1509,16 @@
 #define SORGQR SORGQR_64
 #define SORGR2 SORGR2_64
 #define SORGRQ SORGRQ_64
+#define SORGLK SORGLK_64
+#define SORGKL SORGKL_64
+#define SORGKR SORGKR_64
+#define SORGRK SORGRK_64
 #define SORGTR SORGTR_64
 #define SORGTSQR SORGTSQR_64
 #define SORGTSQR_ROW SORGTSQR_ROW_64
+#define SLUMM SLUMM_64
+#define STRTRM STRTRM_64
+#define STRMMOOP STRMMOOP_64
 #define SORHR_COL SORHR_COL_64
 #define SORM22 SORM22_64
 #define SORM2L SORM2L_64
 
@@ -186,20 +186,19 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
          !     and thus don't reference whatever is present in C2 
          !     at the beginning.
          LOGICAL           C2I
-
          ! Array arguments
          REAL              V(LDV,*), C(LDC,*), T(LDT,*)
          ! Local scalars
-         LOGICAL           QR, LQ, QL, DIRF, COLV, SIDEL, SIDER,
+         LOGICAL           QR, LQ, QL, RQ, DIRF, COLV, SIDEL, SIDER,
      $                     TRANST
          INTEGER           I, J
          ! External functions
          LOGICAL           LSAME
          EXTERNAL          LSAME
-         ! External Subroutines
+         ! External subroutines
          EXTERNAL          SGEMM, STRMM, XERBLA
          ! Parameters
-         REAL              ONE, ZERO, NEG_ONE
+         REAL             ONE, ZERO, NEG_ONE
          PARAMETER(ONE=1.0E+0, ZERO = 0.0E+0, NEG_ONE = -1.0E+0)
 
          ! Beginning of executable statements
@@ -225,10 +224,7 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
 
          ! RQ is when we store the reflectors row by row and have the
          ! 'first' reflector stored in the last row
-         ! RQ = (.NOT.DIRF).AND.(.NOT.COLV)
-         ! Since we have exactly one of these 4 modes, we don't need to actually
-         ! store the value of RQ, instead we assume this is the case if we fail
-         ! the above 3 checks.
+         RQ = (.NOT.DIRF).AND.(.NOT.COLV)
 
          IF (QR) THEN
             ! We are computing C = HC = (I - VTV')C
@@ -313,7 +309,7 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             CALL STRMM('Left', 'Lower', 'No Transpose', 'Unit',
      $                  K, N, NEG_ONE, V, LDV, C, LDC)
          ELSE IF (LQ) THEN
-            ! We are computing C = CH' = C(I-V'T'V)
+            ! We are computing C = C op(H) = C(I-V' op(T) V)
             ! Where: V = [ V1 V2 ] and C = [ C1 C2 ]
             ! with the following dimensions:
             !     V1\in\R^{K\times K}
@@ -325,20 +321,20 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             ! without having to allocate anything extra.
             ! This lets us simplify our above equation to get
             !
-            ! C = CH' = [ 0, C2 ](I - [ V1' ]T'[ V1, V2 ])
-            !                         [ V2' ]
+            ! C = C op(H) = [ 0, C2 ](I - [ V1' ]op(T)[ V1, V2 ])
+            !                             [ V2' ]
             !
-            !   = [ 0, C2 ] - [ 0, C2 ][ V1' ]T'[ V1, V2 ]
+            !   = [ 0, C2 ] - [ 0, C2 ][ V1' ]op(T)[ V1, V2 ]
             !                          [ V2' ]
             !
-            !   = [ 0, C2 ] - C2*V2'*T'[ V1, V2 ]
+            !   = [ 0, C2 ] - C2*V2'*op(T)[ V1, V2 ]
             !
-            !   = [ -C2*V2'*T'*V1, C2 - C2*V2'*T'*V2 ]
+            !   = [ -C2*V2'*op(T)*V1, C2 - C2*V2'*op(T)*V2 ]
             !
             ! So, we can order our computations as follows:
             !
             ! C1 = C2*V2'
-            ! C1 = C1*T'
+            ! C1 = C1*op(T)
             ! C2 = C2 - C1*V2
             ! C1 = -C1*V1
             !
@@ -349,9 +345,6 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             IF( .NOT.SIDER ) THEN
                CALL XERBLA('SLARFB0C2', 2)
                RETURN
-            ELSE IF(.NOT.TRANST) THEN
-               CALL XERBLA('SLARFB0C2', 3)
-               RETURN
             END IF
             !
             ! C1 = C2*V2'
@@ -370,8 +363,13 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             !
             ! C1 = C1*T'
             !
-            CALL STRMM('Right', 'Upper', 'Transpose', 'Non-unit',
-     $            M, K, ONE, T, LDT, C, LDC)
+            IF (TRANST) THEN
+               CALL STRMM('Right', 'Upper', 'Transpose',
+     $               'Non-unit', M, K, ONE, T, LDT, C, LDC)
+            ELSE
+               CALL STRMM('Right', 'Lower', 'No Transpose',
+     $               'Non-unit', M, K, ONE, T, LDT, C, LDC)
+            END IF
             !
             ! C2 = C2 - C1*V2 = -C1*V2 + C2
             !
@@ -472,8 +470,8 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             !
             CALL STRMM('Left', 'Upper', 'No Transpose', 'Unit',
      $         K, N, NEG_ONE, V(M-K+1,1), LDV, C(M-K+1,1), LDC)
-         ELSE ! IF (RQ) THEN
-            ! We are computing C = CH' = C(I-V'T'V)
+         ELSE IF (RQ) THEN
+            ! We are computing C = C op(H) = C(I-V' op(T) V)
             ! Where: V = [ V2 V1] and C = [ C2 C1 ]
             ! with the following dimensions:
             !     V1\in\R^{K\times K}
@@ -485,36 +483,33 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
             ! without having to allocate anything extra.
             ! This lets us simplify our above equation to get
             !
-            ! C = CH' = [ C2, 0 ] (I - [ V2' ]T'[ V2, V1 ]
-            !                          [ V1' ]
+            ! C = C op(H) = [ C2, 0 ] (I - [ V2' ]op(T)[ V2, V1 ]
+            !                              [ V1' ]
             !
-            !   = [ C2, 0 ] - [ C2, 0 ] [ V2' ]T'[ V2, V1 ]
+            !   = [ C2, 0 ] - [ C2, 0 ] [ V2' ]op(T)[ V2, V1 ]
             !                           [ V1' ]
             !
-            !   = [ C2, 0 ] - C2*V2'*T'[ V2, V1 ]
+            !   = [ C2, 0 ] - C2*V2'*op(T)[ V2, V1 ]
             !
-            !   = [ C2, 0 ] - [ C2*V2'*T'*V2, C2*V2'*T'*V1 ]
+            !   = [ C2, 0 ] - [ C2*V2'*op(T)*V2, C2*V2'*op(T)*V1 ]
             !
-            !   = [ C2 - C2*V2'*T'*V2, -C2*V2'*T'*V1 ]
+            !   = [ C2 - C2*V2'*op(T)*V2, -C2*V2'*op(T)*V1 ]
             !
             ! So, we can order our computations as follows:
             !
             ! C1 = C2*V2'
-            ! C1 = C1*T'
+            ! C1 = C1*op(T)
             ! C2 = C2 - C1*V2
             ! C1 = -C1*V1
             !
             !
             ! To achieve the same end result
             !
-            ! Check to ensure side and trans are the expected values 
+            ! Check to ensure side has the expected value
             !
             IF( .NOT.SIDER ) THEN
                CALL XERBLA('SLARFB0C2', 2)
                RETURN
-            ELSE IF(.NOT.TRANST) THEN
-               CALL XERBLA('SLARFB0C2', 3)
-               RETURN
             END IF
             !
             ! C1 = C2*V2'
@@ -530,10 +525,15 @@ SUBROUTINE SLARFB0C2(C2I, SIDE, TRANS, DIRECT, STOREV, M, N,
      $            ONE, C, LDC, V, LDV, ZERO, C(1, N-K+1), LDC)
             END IF
             !
-            ! C1 = C1*T'
+            ! C1 = C1*op(T)
             !
-            CALL STRMM('Right', 'Lower', 'Transpose', 'Non-unit',
-     $         M, K, ONE, T, LDT, C(1, N-K+1), LDC)
+            IF( TRANST ) THEN
+               CALL STRMM('Right', 'Lower', 'Transpose',
+     $            'Non-unit', M, K, ONE, T, LDT, C(1, N-K+1), LDC)
+            ELSE
+               CALL STRMM('Right', 'Upper', 'No Transpose',
+     $            'Non-unit', M, K, ONE, T, LDT, C(1, N-K+1), LDC)
+            END IF
             !
             ! C2 = C2 - C1*V2 = -C1*V2 + C2
             !
Original file line number	Diff line number	Diff line change
`@@ -207,28 +207,12 @@ SUBROUTINE DORGRQ( M, N, K, A, LDA, TAU, WORK, LWORK, INFO )`
`207`	`207`	`* Determine when to cross over from blocked to unblocked code.`
`208`	`208`	`*`
`209`	`209`	`NX = MAX( 0, ILAENV( 3, 'DORGRQ', ' ', M, N, K, -1 ) )`
`210`		`- IF( NX.LT.K ) THEN`
`211`		`-*`
`212`		`-* Determine if workspace is large enough for blocked code.`
`213`		`-*`
`214`		`- LDWORK = M`
`215`		`- IWS = LDWORK*NB`
`216`		`- IF( LWORK.LT.IWS ) THEN`
`217`		`-*`
`218`		`-* Not enough workspace to use optimal NB: reduce NB and`
`219`		`-* determine the minimum value of NB.`
`220`		`-*`
`221`		`- NB = LWORK / LDWORK`
`222`		`- NBMIN = MAX( 2, ILAENV( 2, 'DORGRQ', ' ', M, N, K,`
`223`		`- $ -1 ) )`
`224`		`- END IF`
`225`		`- END IF`
`226`	`210`	`END IF`
`227`	`211`	`*`
`228`	`212`	`IF( NB.GE.NBMIN .AND. NB.LT.K .AND. NX.LT.K ) THEN`
`229`	`213`	`*`
`230`	`214`	`* We want to use the blocking method as long as our matrix is big enough`
`231`		`-* and it's deemed worthwhile with the extra memory allocations`
	`215`	`+* and it's deemed worthwhile`
`232`	`216`	`*`
`233`	`217`	`KK = K`
`234`	`218`	`ELSE`
`@@ -256,13 +240,13 @@ SUBROUTINE DORGRQ( M, N, K, A, LDA, TAU, WORK, LWORK, INFO )`
`256`	`240`	`CALL DLARFT( 'Transpose', 'Rowwise', N-K+I+IB-1, IB,`
`257`	`241`	`$ A( II, 1 ), LDA, TAU( I ), A( II, N-K+I ), LDA )`
`258`	`242`	`*`
`259`		`-* Apply H**T to A(1:m-k+i-1,1:n-k+i+ib-1) from the right`
	`243`	`+* Apply H to A(1:m-k+i-1,1:n-k+i+ib-1) from the right`
`260`	`244`	`*`
`261`	`245`	`CALL DLARFB0C2(.TRUE., 'Right', 'No Transpose', 'Backward',`
`262`	`246`	`$ 'Rowwise', II-1, N-K+I+IB-1, IB, A(II,1), LDA,`
`263`	`247`	`$ A( II, N-K+I ), LDA, A, LDA)`
`264`	`248`	`*`
`265`		`-* Apply H**T to columns 1:n-k+i+ib-1 of current block`
	`249`	`+* Apply H to columns 1:n-k+i+ib-1 of current block`
`266`	`250`	`*`
`267`	`251`	`CALL DORGRK( IB, N-K+I+IB-1, A( II, 1 ), LDA )`
`268`	`252`