mirror of
https://github.com/intel/isa-l.git
synced 2025-01-19 04:26:08 +01:00
igzip: Speed up hash table initialization in igzip_update_histogram.
Signed-off-by: Roy Oursler <roy.j.oursler@intel.com> Reviewed-by: Greg Tucker <greg.b.tucker@intel.com>
This commit is contained in:
parent
39ce31de30
commit
4d40cd360d
@ -70,6 +70,15 @@ global %1
|
|||||||
%define ytmp0 ymm0
|
%define ytmp0 ymm0
|
||||||
%define ytmp1 ymm1
|
%define ytmp1 ymm1
|
||||||
|
|
||||||
|
%if(ARCH == 01)
|
||||||
|
%define vtmp0 xtmp0
|
||||||
|
%define vtmp1 xtmp1
|
||||||
|
%define V_LENGTH 16
|
||||||
|
%else
|
||||||
|
%define vtmp0 ytmp0
|
||||||
|
%define vtmp1 ytmp1
|
||||||
|
%define V_LENGTH 32
|
||||||
|
%endif
|
||||||
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
||||||
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
||||||
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
|
||||||
@ -162,10 +171,12 @@ skip1:
|
|||||||
lea rfc_lookup, [rfc1951_lookup_table]
|
lea rfc_lookup, [rfc1951_lookup_table]
|
||||||
|
|
||||||
;; Init hash_table
|
;; Init hash_table
|
||||||
mov rcx, (HASH_SIZE-1)
|
MOVDQU vtmp0, [D_vector]
|
||||||
|
mov rcx, (HASH_SIZE - V_LENGTH)
|
||||||
init_hash_table:
|
init_hash_table:
|
||||||
mov word [histogram + _hash_offset + 2*rcx], -(D+1)
|
MOVDQU [histogram + _hash_offset + 2 * rcx], vtmp0
|
||||||
sub rcx, 1
|
MOVDQU [histogram + _hash_offset + 2 * (rcx + V_LENGTH / 2)], vtmp0
|
||||||
|
sub rcx, V_LENGTH
|
||||||
jge init_hash_table
|
jge init_hash_table
|
||||||
|
|
||||||
sub file_length, LA_STATELESS
|
sub file_length, LA_STATELESS
|
||||||
@ -471,6 +482,8 @@ compare_loop2:
|
|||||||
jmp len_dist_lit_huffman
|
jmp len_dist_lit_huffman
|
||||||
|
|
||||||
section .data
|
section .data
|
||||||
align 4
|
align 32
|
||||||
const_D: dq D
|
D_vector: dw -(D + 1), -(D + 1), -(D + 1), -(D + 1)
|
||||||
const_30: dq 30
|
dw -(D + 1), -(D + 1), -(D + 1), -(D + 1)
|
||||||
|
dw -(D + 1), -(D + 1), -(D + 1), -(D + 1)
|
||||||
|
dw -(D + 1), -(D + 1), -(D + 1), -(D + 1)
|
||||||
|
Loading…
x
Reference in New Issue
Block a user